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(54) Bacteries lactiques produlsant des exopolysaccharides 

(57) Fragment d'ADN d'origine g6nomique codant 
pour au moins une enzyme impliquee dans la biosyn- 
thfcse d'un EPS, et capable suite a la transformation 
d'une bacterie lactique de restaurer la production d'un 
EPS dans ladite bacterie n'en produisant pas initiale- 
ment, ou de modifier la structure de I'EPS produit initia- 
lement par ladite bacterie. Prolines de la souche 
Streptococcus thermophilus CNCM 1-1590 codees par 
le chromosome et qui sont impliquees dans la biosyn- 
th&se de I'EPS ayant la composition Glc:Gal:Gal- 
Nac=1:2:1. Proc6d6 de fabrication d'un nouvel EPS, 
dans lequel on clone dans un vecteur un fragment 
d'ADN codant partiellemerrt ou totalement pour au 
moins une enzyme impliquee dans la biosynth&se d'un 
EPS, on transforme des bact6ries lactiques produisant 
un autre EPS par le vecteur recombinant, puis on selec- 
tionne une bacterie lactique produisant un nouvel EPS. 



CO 

o 
o 

o 

CL 

LU 



Printed by Rank Xerox (UK) Business Servioes 
2.13.10/3.4 



EP0750 043A1 



Description 

La prgsente invention se rapporte k I'utilisation de fragments d'ADN chromosomique de bactgries lactiques codant 
pour au moins une enzyme impliquge dans la biosynthgse d'axopolysaccharides, ainsi que des enzymes codges par 
5 ces fragments. 

Etat de la technique 

II est connu que les bactgries lactiques sont susceptibles de produire dans leur milieu de culture deux classes de 
10 polysaccharides, k savoir les homopolysaccharides comme les dextranes ou les levanes qui sont constitugs par 
rassemblage rgpgtg d'un seul sucre, et les hgtgropolysaccharides appends commungmerrt exopoly saccharides ou 
EPS (EPS est I'abrgviation du terme "exopolysaccharide") constitugs par rassemblage de plusieurs sucres dtffgrents 
formant une unitg rgpgtitive (Cerning J., Bactgries lactiques, Vol I, de Rossart H et Luquet F. M., Lorica, 309-329, 1994). 
Une bactgrie lactique produisant un EPS peut conferer un caractgre f ilant et/ou une texture lisse et crgmeuse k un 
15 lait acidrfig (Cerning et al., FEMS Microbiol., 87, 1 13-130, 19/90). Les EPS peuvent aussi presenter des activrtes bio- 
logiques particuli&rement intgressantes pour la santg humaine ou animale, comme des activitgs anti-tumeurs ou pro- 
biotiques, par exemple (Oda M. era/., Agric. Biol. Chem., 47, 1623-1625, 1983; EP94870139.6) 

Par ailleurs, I'industrie est confront6e k une instability ggngtique de la biosynthgse des EPS dans les bactgries lac- 
tiques. Ceci se traduit ggngralement au cours d'une fermentation par la perte de la production d'EPS par tout ou partie 
20 des bactgries lactiques (voir "Cerning J." ci-dessus). Les produits fermentgs industries sont ainsi sujets k des varia- 
tions dans leur contenu en EPS, ce qui n'est pas toujours acceptable. Pour remgdier k ces problgmes, Industrie 
recours actuellement k isolation et la caractgrisation pgriodique de ses bactgries de manigre k sgparer celles qui ont 
perdu leur caractgre originel. 

La biosynthgse d'EPS dans les bactgries lactiques mgsophiles, c'est k dire les bactgries lactiques ayant une crois- 
25 sance optimale k 28-37°C, implique au moins une enzyme qui assure I'enchaTnement des sucres. Aucun ggne chromo- 
somique ou plasmidique de bactgries lactiques mgsophiles codant pour une telle enzyme n'a encore gtg rdentrf ig et 
sgquencg, bien que Ton connaisse des plasmides impliqugs dans la biosynthgse d'EPS. 

WO 92/02142 rgvgle ainsi I'existence du plasmide pHV67 qui produit dans Lactococcus lactis subsp. lactis (mgso- 
phile) une substance capable d'augmenter la viscosity d'un lait ferments. US5066588 decrit deux plasmides provenant 
so d'une souche de Streptococcus cremoris (mesophile) capable de confgrer un caractgre epaississant k un Streptococ- 
cus lactis. De m§me, Vescovo et al. ont mis en gvidence un plasmide d'une souche Lactobacillus casei subsp. casei 
(mgsophile) codant pour un phgnotype Muc+, c'est k dire pour des fonctions liges k la production d'epaississants exo- 
cellulaires (Vescovo etaL, Biotechnology Letters, Vol II, 709-712, 1989). 

Enf in, Van den Berg et al. cherchent k isoler d'un Lactobacillus sake (mgsophile) un groupe de ggnes chromoso- 
35 miques impliqugs dans la biosynthgse d'un EPS (Van den Berg D.J.C. ef al., First International Conference on Polysac- 
charide Engineering, Trondheim, Norway, June 6-8, 1994). Cependant aucun ggne n'a encore gtg iderrtifig et/ou 
sgquencg. 

D'un autre cotg, la biosynthgse d'EPS dans les bactgries lactiques thermophiles, c'est k dire les bactgries lactiques 
ayant une croissance optimale k 37-45°C, n'est pas encore bien connue. On sait cependant qu'elle n'est pas associge 
40 k un plasmide. Vescovo et al. ont ainsi montrg que le phgnotype Muc+ de la souche Lactobacillus delbrueckii subsp 
bulgaricus 2o1 (thermophile) est lig k des fonctions chromosomiques (Vescoso et aL, Biotechnology Letters, Vol II, 
709-712, 1989). 

Ainsi k ce jour, aucun ggne ou groupe de ggnes chromosomiques ou plasmidiques codant pour un EPS de bactg- 
ries lactiques mgsophiles ou thermophiles n'a gtg identifig et/ou sgquencg. 
45 II serait done tr&s intgressant d'avoir des moyens pour restaurer ou stabiliser la production originelle d'EPS dans 
les bactgries lactiques. De plus, il serait ggalement irrtgressant d'avoir des moyens pour modifier la structure d'un EPS, 
et crger de ce fait de nouveaux EPS pouvant avoir des proprigtgs intgressantes. 

Rgsumg de I'invention 

50 

L'invention se destine k fournir des nouveaux moyens pour contrfller, modifier et/ou restaurer la synthgse d'EPS in- 

vivo et in- vitro. 

A cet effet, la prgsente invention concerne tout ADN d'origine chromosomique de bactgrie lactique codant pour au 
moins une enzyme impliquge dans la biosynthgse de I'EPS prgsentant la structure rgpgtge 

55 
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->x>A-(l -> x>A-<l ->x)-A<l- 

y 



1 

A 



n, 



10 



0C1 n > 1 ; A est choisi dans ie groupe form6 par p-D-Galp, p-D-Glcp et leurs d6riv6s acetyl et phosphatyl; et x et y = 2, 
3, 4, 5 ou 6 sachant que x * y. 

75 Un autre objet de la pr6sente invention concerne les vecteurs recombinants comprenant un fragment d'ADN selon 
la pr6sente invention. 

Un autre objet de la pr6sente invention concerne une protein e susceptible d'&tre impliqu6e dans la biosynth&se de 
I'EPS ayant la structure r6p6t6e 

20 

~>3>f^D-Galp( 1 ->3)-p-D-Glcp( 1 ->3)-(3-D-Gal/?NAc( 1 --> 

6 



p -D-Galp 

ladite prot6ine ayant la sequence en acides amines choisie dans le groupe form6 par les sequences SEQ ID NO:2, 3, 
4, 5, 6, 7, 8, 9. 10. 1 1 , 12, 13, 14, et les sequences homologues (sequences pr6sent6es dans la liste de sequences ci- 
30 apr&s). 

Un autre objet de la pr6sente invention concerne une bact6rie lactique comprenant, int6gr6 dans son chromosome 
ou par le moyen d'un plasmide r6plicable, un fragment d'ADN selon I'invention. 

Un autre objet de la pr6sente invention concerne un proc6d6 de production d'un EPS, dans lequel (1) on clone 
dans un vecteur un fragment d'ADN codant pour les enzymes selon I'invention, ledit vecteur comprenant en outre une 
35 sequence permettant la replication autonome ou Integration dans une cellule hdte, (2) on transforme une cellule hdte 
par ledit vecteur, (3) puis on cultive la cellule hdte transform^ dans des conditions approprtees pour la production d'un 
EPS. 

(-'invention concerne aussi un autre proc6d6 de production d'un nouvel EPS dans lequel, (1) on clone dans un vec- 
teur un fragment d'ADN codant pour au moins une enzyme impliquGe dans la biosynth^se d'un EPS, (2) on transforme 
40 une bacterie lactique par ledit vecteur, (3) puis on cultive la bacterie lactique transforms dans des conditions appro- 
prices pour la production d'un nouvel EPS. 

La pr6sente invention ouvre done la possibility d'utiliser des fragments d'ADN selon I'invention pour restaurer ou 
modifier la production d'EPS dans une bact6rie lactique. On peut ainsi envisager d'exprimer ou de surexprimer dans 
une bacterie lactique I'expression des ADN selon I'invention, pour produire des EPS destines & 6paissir et rendre cr6- 
45 meux des boissons ou de la nourriture comme des desserts liquides, des yogourts, des soupes, des crimes glac6s, 
des crimes de cafe, des sauces ou des mayonnaises, par exemple. 

La pr6sente invention permet aussi d'avoir des moyens nouveaux pour identifier des g6nes chromosomiques de 
bacteries lactiques impliqu6s dans la biosynthSse d'EPS. 

Enf in, la pr6sente invention fournie aussi de nouvelles enzymes impliqu6es dans la biosynthfcse de I'EPS d6crit ci- 
50 dessus. Ces enzymes peuvent §tre ainsi avantageusement utilis6es pour synth6tiser ou modifier in-vitro un polysac- 
charide, comme un oligosaccharide ou un EPS, par exemple (Ichikawa Y. et al., American Chemical Society, 114, 9283- 
9289, 1992). 

Description des figures: 

55 

Figure 1 .A. Carte physique de I'op6ron impliqu6e dans ia synthase de I'EPS de la souche S. thermophilus CNCM 
1-1590. Les promoteurs et terminateurs sont respectivement r pr6sent6s par des drapeaux et des 6pingles-&-che- 
veux. Lafl&che verticale indique la position du site d'insertion du transposon Jn916. Les flfcches horizontales indi- 
quent la presence de cadres de lectures (ORF) potentiels. Les noms des g&nes correspondants aux ORFs sont 
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indiqu6s en dessous des filches. Les enzymes de restrictions sort representees de manure abr6g6 (S^SacI; H= 
H/ndlll; E= EcoRI; B=BamHI). 

Figure 1.B. Representation des inserts chromosomiques de ia souche CNCM 1-1590, presents dans les 1 1 vec- 
s teurs pFS. P1 . P2 et P3 indiquent la position des sondes qui sort utilis6es pendant le criblage. 

Figure 1 .C. Representation de I'insert genomique pFS101 comprenant tout I'operon eps du site de restriction Sacl 
k BamHY, qui est clone dans pJIM2279. 

to Figure 2. Representation de la densite optique k 485nm des fractions de chromatographie par gel-filtration com- 
prenant les sucres produits par la souche Lactococcus lactis MG1363 transform6e par pFSl 01 ou pJ IM2279. Frac- 
tion 9: 2x10 6 Dalton (Da); fractions 11-13: 5x10 5 Da; fractions 14-16: 7.2x10 4 Da; fractions 17-18: 4x10 4 Da; . 
fraction 19 et sup6rieures: < 5x10 3 Da. 

15 Description detailiee de rinvertion 

Dans la suite de la description, le terme "EPS" designe un exopolysaccharide produit par une bacterie lactique qui 
est constitue par I'assemblage de plusieurs sucres differents formant une unite repetitive. 

On designe par les derives acetyl et phosphatyl, le galactose ou le glucose comprenant au moins un radical acetyl 
20 et phosphatyl aux positions C 2 k C 6 sur le cycle du Sucre. 

Au sens de la presente invention, on entend par "sequence homologue" toute sequence nucieique ou d'acides ami- 
nes ayant une fonction identique, ne diff6rant des sequences selon Tinverttion que par la substitution, la deletion ou 
I'addition d'un petit nombre de bases nucieiques ou d'acides amines, par exemple 1 k 500 paires de bases (pb) ou 1 k 
150 acides amines. 

25 Dans ce cadre, on considerera en particulier comme homologues deux sequences d'ADN qui, du fait de la d6g6- 
nerescence du code genetique, codent pour un m§me polypeptide. De m§me. on considerera comme homologues 
deux proteines fonction nelles qui sort reconnues par un m§me anticorps, le rapport des valeurs d'intensite de recon- 
naissance des deux proteines par I'anticorps n'excedant pas 1000, de preference 100, par exemple. 

On considerera aussi comme sequence homologue, cede qui presente plus de 70% d'homologie avec les sequen- 

30 ces selon I'invention, en particulier plus de 80% ou 90%. Dans ce dernier cas, I'homologie est determines par le rapport 
entre le nombre de bases ou d'acides amines d'une sequence homologue qui sont identiques k celles d'une sequence 
selon ('invention, et le nombre total de bases ou d'acides amines de ladite sequence selon I'invention. 

Au sens de la presente invention, on entend par "fragment qui s'hybride" tout fragment capable de s'hybrider aux 
fragments selon I'invention par ia methode de Southern-Blot (Sambrook et al.., Molecular Cloning, A Laboratory 

35 Manual, Cold Spring Harbor Laboratory Press, U.S.A., 1989, chapitres 9.31 k 9.58). De preference, I'hybridation est 
conduite dans des conditions stringent es de manure k eviter des hybridations aspecifiques ou peu stables. 

Enf in, le terme "fragment" ou "fragment d'ADN" doit §tre compris comme un ADN double brin d'origine chromoso- 
mique, qui peut etre synthetise, reproduit in-vitro par exemple par la methode connue appeiee "Polymerase Chain 
Reaction", ou reproduit in-vivo dans une bacterie du type Escherchia coil, Lactococcus lactis, ou Streptococcus 

40 thermophilus par exemple. 

Pour seiectionner un fragment d'ADN selon la presente invention, il est possible de constituer une banque de 
grands fragments d'ADN d'une bacterie lactique produisant un EPS dans une bacterie lactique ne produisant pas 
d'EPS, puis de seiectionner le ou les cl6ne(s) produisant un EPS. Pour cela, on digere PADN genomique d'une bacterie 
lactique produisant un EPS par une enzyme de restriction qui est specifique d'un site de restriction relativement rare 

45 (BamHI, Sa/I, Pst\) ou par une digestion partielle avec Sau3A, par exemple. On clone le produit de digestion dans un 
plasmide d'expression ou d'integration qui accepte de grands fragments (plasmide pSA3 decrit k I'exemple II), on intro- 
duit les plasmides recombinants dans la mdme esp£ce de bacterie lactique ne produisant pas d'EPS, on seiectionne 
au moins un clone transforme produisant un EPS, puis on identrfie, on isole et on sequence classiquement le fragment - 
d'ADN responsable de la production d'EPS. 

so Vu que les fragments d'ADN selon la presente invention sont susceptibles d'etre de grande taille, du fait qu'ils peu- 
vent contenir un groupe de genes impliques dans la biosynthese d'EPS, on peut pr6f6rer introduire les plasmides 
recombinants dans la m§me souche de bacterie lactique dont provienne les fragments, k la difference prks que cette 
souche a perdu la capacite de produire des EPS suite k un traitement mutagenique (traitement U.V., chimique ou par 
transposon). 

55 Une alternative k la methode decrite ci-dessus peut aussi consister k constituer une banque plasmidique de frag- 
ments d'ADN d'une souche de bacterie lactique produisant un EPS, k transformer la m§me souche de bacterie lactique 
par les plasmides incapables de s'y repliquer, k seiectionner les transformants ayant integre un plasmide dans leur 
genome par recombinaison homologue (selection par une resistance k un antibiotique, par exemple), k seiectionner les 
transformants ne produisant plus d'EPS, puis k isoler et sequencer les fragments d'ADN chromosomique des transfor- 
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mants selectionnes qui sont adjacerrts au plasmide integre. Pour cela, on peut digerer le chromosome des transfor- 
mants, le liguer, puis effectuer une PCR-inverse a I'aide de sondes specifiques du plasmide integre ou introduire le 
produit de ligation dans une souche dans laquelle le plasmide recircularis6 est capable de se repliquer, par exempie. 
Une autre alternative a la methode de selection decrite ci<Jessus peut aussi consister a transformer des bacteries 

5 lactiques produisant un EPS par un plasmide comprenant un transposon, a soumettre les bacteries a des conditions 
dans lesquelles le transposon s'excise du vecteur et s'integre au hasard dans le genome, a selectionner les clones de 
bacteries ayant perdu la capacite de produire des EPS, a isoler les fragments d'ADN genomiques desdits clones dans 
lesquels un transposon s'est integre. Cette m6thode est decrite plus en detail dans I'exemple I pr6sente ci-apres. 
II faut remarquer que les methodes de selection decrites brievement ci-dessus peuvent §tre appliquees a toutes 

10 les bacteries lactiques connues, notamment aux bacteries lactiques mesophiles comme par exempie Streptococcus 
cremoris, Streptococcus lactis, Lactobacillus casei subsp. casei et Lactobacillus sake, et les bacteries lactiques ther- 
mophiles comme par exempie Streptococcus thermophilus, Lactobacillus delbrueckisdbsp. bulgaricus et Lactobacillus 
helveticus. A cet effet, I'homme du metier dispose de techniques de transformation pour chaque espece de bacterie 
lactique, et en particulier pour Lactobacillus delbruecki subsp. bulgaricus (Sasaki Y. et aL, FEMS Microbiology 

is Reviews, 12, Fourth Symposium on Lactic Acid Bacteria, Noodwijkerhout, The Netherlands, Sept 1993). 

De plus, les methodes de selection decrites ci-dessus permettent le plus souvent dlsoler seulement une partie 
d'un gene ou d'un groupe de genes impliques dans la biosynthese d'un EPS. Neanmoins, I'homme du m6tier peut fad- 
lement identifier la partie restante du gene ou du groupe de genes en selectionnant dans une banque chromosomique, 
a Taide de sondes nucleiques basees sur un fragment isole, un ou plusieurs clones renfermant la partie restante, par 

20 exempie (voir I'exemple I.6) 

On a pu ainsi caracteriser une sequence d'ADN de 15,2 kb de la souche Streptococcus thermophilus d6posee le 
7 juin 1995, aupres de la Collection Nationale de Culture de Microorganisme (C.N.C.M.), Institut Pasteur, 28 rue du Dr 
Roux, 75724 Paris cedex 15, France, ou elle a regu le numero de d6pdt CNCM 1-1 590. Par ailleurs, cette souche Gram- 
positif presente au microscope un aspect de coques non f lagellees formant des chatnettes. Cette souche ne fait pas de 

25 spores et elle est anaeorobe facultative. 

Cette sequence de 15,2kb comprend des genes codant pour des enzymes nouvelles impliquees dans la biosyn- 
these d'un EPS ayant la structure repetee 



->3)-p-D-Galp(l->3>P-D-GIcp(l-->3)-P-D-Gal/7NAc(l-> 



(3 -D-Galp 

35 



Les nucleotides 648 a 15250 de cette sequence de I5,2kb sont represents dans la sequence SEQ ID NO:1 don- 
nee dans la liste de sequence ci-apres. 13 genes complets sont delimites dans la sequence nucleique SEQ ID NO:1 

40 par les nucleotides 352-1803, 1807-2535, 2547-3239. 3249-3995, 4051-4731, 4898-5854, 6425-7540, 7736-8212, 
8221-9192, 9285-10364, 10392-11339, 11302-12222, et 12233-13651. 

On a pu montrer que tout ou partie de la sequence SEQ ID NO: 1 kb permet, suite a une transformation, de restau- 
rer une biosynthese d'EPS dans une cellules hdte, comme une bacterie lactique mesophile ou thermophile qui initial e- 
ment n'en produisait pas, notamment dans un Streptococcus ou un Lactococcus. A titre d' exempie, la sequence d'ADN 

45 selon I'invention peut ainsi Stre utilisee pour restaurer la production d'EPS dans un mutant de la souche S. 
thermophilus CNCM 1-1590 n'en produisant plus (mutant naturel ou issu d'une mutagenese). 

Pour restaurer la biosynthese d'un EPS, on peut integrer tout ou partie de la sequence SEQ ID NO:1 comprenant 
au moins un des genes precites dans une cellule h6te au moyen du proceed d6critdans EP564966, ledit procecle 6tant 
incorpore par ref6rence dans Tenseignement de la presente invention. En resume, ce proc6d6 permet de pouvoir (1) 

so transformer la cellule hdte avec un plasmide donneur qui ne s'y replique pas, ledit plasmide comprenant ledit fragment 
integre fonctionnellement (le cadre de lecture est conserve) dans une partie d'un operon issu de la cellule hflte; (2) 
identifier les transformants comprenant integre la totality du plasmide; (3) selectionner des transformants comprenant 
uniquement integr6 dans le chromosome le fragment selon Unvention, les autres sequences du plasmide s'etant excise 
du chromosome; (4) et cultiver les transformants s6lectionnes dans des conditions appropriees pour la production d'un 

55 EPS. 

On peut noter que c procede permet de ne pas utiliser des sequences promoteur et d'activation traductionnelle 
fonctionnels. De plus, les conditions de culture appropriees pour la production d'EPS sont a la portee d Thomme du 
metier, qui peut utiliser des milieux de culture standards, et choisir le pH, la temperature et I'agitation du milieu optimum 
selon la souche utilisee. 
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On peut aussi choisir de doner tout ou partie de la sequence SEQ ID NO:1 comprenant au moins un des genes 
pr6crt6s dans un plasmide d'expression autoreplicatif en aval de sequences promoteur et d'activation traductionnelle 
fonctionnels, et le cas 6ch6ant en amont d'un terminateur, puis de transformer une cellule hdte par le plasmide recom- 
binant. 

5 Par ailleurs, on peut observer que 1'EPS produit par une cellule hdte transforms par la sequence SEQ ID NO:1 , 
par exemple un Lactococcus lactis ne produisant pas initialement un EPS, peut §tre different de I'EPS qui devrait §tre 
normalement synth6tis6 par les enzymes recombinantes, en I'occurence I'EPS produit par la souche CNCM 1-1590. 
{.'utilisation de tout ou partie de la sequence de 15,2 kb peut done permettre la creation de variants de I'EPS d6crit ci- 
dessus. 

10 De mSme, on a pu montrer que tout ou partie de la sequence SEQ ID NO:1 peut aussi permettre, suite a une trans- 
formation, de modifier la structure r6p6tge d'un EPS produit initialement par une cellule hdte, par exemple par une bac- 
ferie lactique mesophile ou thermophile, notamment un Streptococcus ou un Lactococcus. 

Ces observations ouvrent ainsi la possibility de realiser une methode originale de production d'un nouvel EPS, 
dans laquelle (1) on clone dans un vecteur un fragment d'ADN codant partiellemerrt ou totalement pour au moins une 

15 enzyme impliquge dans la biosynthese d'un EPS; (2) on transforme des bact6ries lactiques par le vecteur recombinant; 
(3) on s6lectionne le cas edfeant une bacferie lactique produisant un nouvel EPS; (4) puis on cultive la bacferie lactique 
transform6e dans des conditions appropri6es pour la production d'un nouvel EPS. De preference le vecteur code pour 
les prolines selon rinvention. De plus la bad6rie lactique peut produire un autre EPS que celui synthetis6 par les pro- 
lines codees par ledit vecteur. 

20 En particulier, on clone dans un vecteur d'integration un fragment d'ADN codant partiellement pour au moins une 
enzyme impliqu6e dans la biosynthese d'un premier EPS, on introduit le vecteur recombinant dans des bacteries lacti- 
ques mesophiles ou thermophiles, pouvant le cas 6ch6ant produire un deuxieme EPS par I'intermediaire d'un ou plu- 
sieurs genes chromosomiques ou plasmidiques, on isole les bacteries ayant infegres dans leur chromosome le vecteur 
d'integration, puis on seledionne celles qui produisent un nouvel EPS a cause de reactivation d'un ou plusieurs genes 

25 impliques dans la biosynthese du deuxieme EPS. De preference, le premier et le deuxieme EPS sont identiques, et on 
choisit un fragment d'ADN codant partiellement (au moins 15 paires de bases) pour au moins une enzyme impliquee 
dans I'adjonction d'un sucre sur la chaine laferale de I'unite repetitive ou dans la modification d'un sucre comme une 
sulpho-, phosphoryi- ou acetyl-transferase, par exemple. 

De m§me, on peut doner dans un vecteur d'expression replicatif un fragment d'ADN codant totalement pour au 

30 moins une enzyme impliqu6e dans la biosynthese d'un premier EPS, on peut introduire le vecteur recombinant dans 
des bacteries lactiques m6sophiles ou thermophiles, pouvant le cas echeant produire un deuxieme EPS par i'interme- 
diaire d'un ou plusieurs genes chromosomiques ou plasmidiques, on peut isoler les bacteries renfermant le vecteur 
replicatif, puis on peut s£lectionner celles qui produisent un nouvel EPS a cause de I'expression d'un ou plusieurs 
genes impliques dans la biosynthese du premier EPS. De preference, on choisit des fragments d'ADN codant pour des 

35 enzymes impliqu6es dans la modification d'un sucre comme une sulpho-, phosphoryi- ou acetyl-transferase par exem- 
ple, ou dans i'adjonction a i'unite repetitive d'un sucre comme une glucosyl-ou une galactosyl-transferase, par exemple. 

De preference, on utilise totalement ou partiellement au moins un des genes porfes par la sequence SEQ ID NO: 1 . 
On peut aussi utiliser au moins un gene plasmidique de bacteries lactiques mesophiles implique dans la biosynthese 
d'un EPS (gene que Ton peut sequencer a partir de plasmides connus). 

40 Enfin, le vecteur recombinant peut §tre tout fragment d'ADN, simple ou double brin, lineaire ou circulaire, d'expres- 
sion ou d'integration, et comprenant un une sequence d'ADN selon I'invention notamment tout ou partie de la sequence 
SEQ ID NO:1 . Dans le cas ou le procede decrit dans EP564966 n'est pas utilise, il faut veiller a ce que le vecteur puisse 
exprimer I'ADN selon I'invention par des sequences nucfeiques adapfees (promoteur; site d'attachement du ribosome; 
codon prefere), et le cas echeant a ce qu'il comprenne une ou plusieurs origines de replication de diverses bacteries, 

45 notamment d' Escherichia coli et/ou d'un Streptococcus, par exemple. 

L'inverrtion concerne aussi les nouvelles enzymes codees par les genes de la sequence SEQ ID NO:1 , notamment 
les sequence qui leur sont homologues On peut ainsi envisager de les utiliser pour modifier ou synthetiser in-vitro un 
oligosaccharide ou un polysaccharide comme un EPS, par exemple. Pour cela, il est preferable de purifier au moins 
une de ces enzymes, en surexprimant classiquement leur gene dans une bacferie et en les isolant dassiquement, par 

so precipitation et/ou chromatographic du milieu de culture, par exemple. 

Un autre objet de la presente invention concerne une bacferie ladique comprenant, integre dans son chromosome 
ou par le moyen d'un plasmide replicable, une sequence d'ADN selon I'invention. De preference, la sequence com- 
prend au moins un des genes de la sequence SEQ ID NO:1. 

I'invention concerne aussi toute utilisation de fragments de la sequence SEQ ID NO:1 ou de fragments du brin 

55 compiementaire de cette sequence, d'au moins 15 paires de bases, comme amorce pour faire une PCR ou comme 
sonde pour detecter in-vitro ou inactiver in-vivo des genes de bacteries lactiques impliques dans la biosynthese d'un 
EPS. Cette limite inferieure est arbitrairement fix£e du fait qu les petite fragments s'hybridant specifiquement ont 
g6n6ralement une longeur de 15-25 pb. 

La presente invention est decrite plus en detail ci-apres a I'aide du complement de description qui va suivre, qui se 
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r6fere a des exemples d'obtention de fragments d'ADN, de plasmides recombinants et de bact6ries transform6es selon 
I'invention. Ces exemples sont pr6c6d6s d'une description des milieux de culture. II va de soi, toutefois, que ces exem- 
ples sont donnas a trtre d'illustration de I'objet de I'invention dont ils ne constituent en aucune manigre une limitation. 
La manipulation de i'ADN, le clonage et la transformation de cellules bact6riennes sont, en ('absence de precisions con- 
5 traires, effectu6s selon les protocoles d6crits dans I'ouvrage de Sambrook et al. cite plus haut. Les pourcentages sont 
donn6s en poids, sauf indication contraire. 

Milieux: (rajouter 1 ,5% de Bacto-agar pour un milieu solide) 

10 - M 1 7 (Drfco. USA): tryptone 0,5%, soytone 0,5%, viande hydrolys6e 0,5%, extrait de levure 0,25%, acide ascorbique 
0,05%, sulphate de magnesium 0,025%, disodium-beta-glyc6rophosphate 1 ,9% et de Teau. 
- LM17: milieu M17 comprenant 1% de lactose. 
GM 1 7: milieu M 1 7 comprenant 1 % de glucose. 

MSK: lait 6cr6m6 (poudre reconstitu6e a 10%) comprenant 0,1% d'extrait de levure. 
15 - MAM: lait 6cr6m6 (poudre reconstitu6e a 10%) comprenant 10% d'un melange d'rides amin6s (495 mg/l Ala, 343 
mg/l Arg, 682 mg/l Asp, 59 mg/l Cys, 1229 mg/l Glu, 759 mg/l Gly, 153 mg/l His, 215 mg/l Iso, 470 mg/l Leu, 565 
mg/l Lys, 122 mg/l Met, 255 mg/l Phe, 436 mg/l Pro, 68 mg/l Ser, 170 mg/l Thr, 61 mg/l Try, 304 mg/l Val ajustt a 
pH5). 

HJL: tryptone 3%, extrait de boeuf 0,2%, extrait de levure 1%, lactose 1% et KH 2 P0 4 pH 6,5 0,5%. 
20 - Rouge de Ruthenium: extrait de levure 0,5%, lait en poudre 6cr6m6 10%, sucrose 1%, agar 1,5% et 0,08g/l de 
rouge de ruth6nium (voir FR2632968). 

Ex emple I; clo na ge d 'un fr agment d'ADN de la souche 5, thermophilus Sfi6 

25 1.1 . Selection d'une souche S. thermophilus productrice d'EPS: on cultive les souches de bact§ries lactiques de la 
collection Nestte dans un milieu liquide HJL et on en Stale des dilutions sur un milieu solide Rouge de Ruthenium. Les 
souches productrices d'EPS demeurent de couleur blanche car les EPS emp§chent le colorant de teinter leur paroi cel- 
lulaire. Par contre, les souches non-productrices se colorent en rouge du fait de I'aff inrte du colorant pour le peptidogly- 
cane de leur paroi cellulaire. 

30 On a ainsi s6lectionn6 parmi les bacteries lactiques productrices d'EPS la souche S. thermophilus Sfi6, qui a recu 
le num6ro de d6pdt CNCM 1-1590 et que Ton dSsignera dans la suite des exemples par I'expression "souche Sfi6". 

I.2 .Structure r6p6t6e de I'EPS: la structure de I'EPS produit par la souche Sfi6 a 6t6 publtee par Doco et al. (Car- 
bohyd.Res., 198, 313-321, 1995). Cet EPSprSsente la composition Glc:Gal:GalNac=1:2:1, et I'unrte tetrasaccharidique 
r6p6t6e: 

35 

->3)-P-D-Galp(l->3>P-D-Glcp(l->3)-p-D-Gal/?NAc(l-> 

6 

I 

40 1 

p-D-Gal/? 



45 1.3. Mutaaenfese par le transposon Tn3/6: on rend la souche Sfi6 rSsistante a la streptomycine en la cultivant par 
des transferts r6p6t6s dans un milieu HJL supplements par des teneurs croissantes de 20 a 2000jig/ml de streptomy- 
cine, puis en sSlectionnant les souches devenues naturellement rSsistantes. 

On conjugue la souche Sfi6 rSsistante & la streptomycine et la souche Enterococcus faecalis JH2-2 qui possSde 
un plasmide pAM180 portant le transposon Tn916 {Tn916 est connu pour porter un gfcne de resistance a la tetracy- 

50 dine; Gawron et al., Nature, 300, 281 -283, 1 982). Pour cela, on melange a 1 ml d'une culture d'une nuit dans un milieu 
M1 7 a 37°C de la souche E. faecalis JH2-2, 10ml d'une culture d'une nuit dans un milieu HJL a 42°C de la souche Sfi6, 
on centrifuge les cellules et on les resuspend dans des tubes comprenant 100yJ de milieu HJL, on depose la suspen- 
sion sur un milieu solide LM17 que Ton incube a 37°C pendant 20h, on rScupSre les cellules par grattage et on les 
resuspend dans des tubes de 10 ml de milieu liquide HJL, on incube les tubes a 42°C pendant 4h en les agitant de 

55 temps en temps, puis on Stale des dilutions des cultures sur un milieu LM1 7 solide supplements de 2,5jjig/ml de tetra- 
cycline et 2000jig/ml de streptomycine. 

En rSalisant 20 conjugaisons en parrallSles (mutations indSpendantes), on a pu ainsi sSlectionner 2x1 0 4 transcon- 
jugants rSsistants a la tetracycline et a la streptomycine. 

I.4. Selection de mutants de la souche Sfi6 ne produisant plus d'EPS fphSnotvpe EPS(-)] : on transfert les transcon- 
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jugants r6sistarrts sur le milieu solide Rouge de Ruthenium supplements par 2,5ng/ml de tetracycline et 2000^g/ml de 
streptomycine. Environ 10% des transconjugarrts torment des colonies rouges EPS(-). On seiectionne ensuite environ 
800 colonies rouges que Ton cultive une nuit dans des plaques de microtitration comprenant 200p.l de milieu HJL sup- 
plements de 2,5|xg/ml de tetracycline. On cultive ensuite 100jil de la culture HJL dans 1 ml d'un lait MSK. Environ, 25% 
des colonies rouges test6es pr6sentent un phSnotype EPS(-) stable dans le lait (le lait n'est pas 6pais et f ilant, et I'ana- 
lyse du surnageant de culture ne r6veie pas d'EPS). Les autres colonies rouges presenter^ un phenotype EPS(+) ou 
retrouvent le phenotype EPS(+) aprSs plusieurs sous-cultures dans le lait. 

En conclusion, les mutants stables EPS(-) ont perdu leur capacity k produire des EPS k cause de Integration du 
transposon Tnd/6 dans un g£ne chromosomique impliqu6 dans la biosynthesedes EPS. En effet, les mutants stables 
EPS(-) peuvent retrouver un phenotype EPS(+) lorsqu'on les cultive dans un milieu de croissance dSpourvu de tetra- 
cycline (excision et perte du transposon). 

1.5 Caracterisation de mutants stables EPSM : on analyse environ 100 mutants stables par Southern-Wot d'une 
preparation d'ADN chromosomique des mutants, dig6r6e par H/ndlll, et hybridation du filtre de Southern-blot avec le 
gene tetM radioactif (code une resistance k la tetracycline) provenant du plasmide plC182 (Hill et a/., Applied and Env. 
Micro., 54, 1230-1236, 1988). Environ 85% des mutants analyses pr6sentent une bande majoritaire identique corre- 
pondant k un locus appelie "locusA". On peut remarquer pour certains des autres mutants deux autres bandes majori- 
ties (locus B et C) correspondarrt k des locus connus impliquSs dans la biosynthSse de la paroi cellulaire (publication 
en preparation). 

1.6 Caracterisation du locus A : les regions chromosomiques proches du transposon Jn9i6 int6gr6 peuvent etre 
isoiees par une PCR-inverse. Pour cela, on dig&re classiquement 1}ig d'une preparation d'ADN chromosomique d'un 
mutant choisi arbitrairement (mutant n°1) par H/ndlll pendant 4h, on extrait I'ADN au phenol/chloroforme, on le dilue 
dans 720jjU d'eau, on chauffe I'ADN dilu6 k 56°C pendant 5 min, on refroidit I'ADN sur de la glace, on lui ajoute 80utl 
d'un tampon de ligation 10 fois concentre et 5 unites d'une T4-ligase (Boehringer-Manheim), on I'incube k 12°C pen- 
dant 16 h, on le chauffe k 70°C pendant 15 min pour inactiver la ligase, puis on le concentre dans un volume de 100u,l 
par plusieurs extractions successives dans du butanol. On ajoute alors dans un disposrtif de PCR 10uJ du melange de 
ligation, 100pmol d'amorces, 15mM de dNTPs, 10^1 de tampon et 0,2 unite de Super-Taq polymerase (Stehlin GmBH). 
Les amorces nucteiques (ou primers) sont choisies k partir de la sequence connue du transposon Tn916. 

En utilisant les amorces ayant la sequence SEQ ID NO:15 et SEQ ID NO:16 on a pu isoler par PCR un fragment 
de 1kb. De plus, en utilisant les amorces SEQ ID NO:17 et SEQ ID NO:18 on a pu isoler un fragment de 4kb (voir la 
liste de sequences ci-apres). 

Un troisieme fragment de 0.8kb peut §tre aussi isoie du mutant n°1 , en realisant une second e PCR-inverse k partir 
de son ADN chromosomique digSre par Rsal et k I'aide des amorces ayant la sequence SEQ ID NO:18 et SEQ ID 
NO:19 (voir la liste de sequence ci-apres). 

Les fragments de 1kb et de 0.8kb ont 6t6 clones dans le plasmide linearise pGEMT (Promega, USA). Le sequen- 
cage de ces fragments par la methode des dideoxynucieotides (kit f-md® DNA Sequencing System, Promega) montre 
deux sequences qui, en se recoupant, couvrent trois cadres de lectures ouvertes (ORFs) correpondants aux nucleoti- 
des 9933 k 1 1643 de la sequence SEQ ID NO:1. 

Les fragments de 1 kb et 4kb ont egalement 6te utilises pour cribler une banque X-ZAP Express (Stratagene, USA) 
renfermant des fragments d'ADN de la souche Sfi6. Pour cela, selon les recommandations du fournisseur on dig6re 
partiellement une preparation d'ADN dudit mutant par Sau3A, on separe les fragments par une eiectrophorese sur gel 
d'agarose, on coupe du gel les bandes correspondantes k des fragments de 5 k 12kb, on eiue I'ADN, puis on le ligue 
au vecteur X-ZAP Express pr6alablement dig6r6 par BamHl On encapside in-vitro le produit de ligation k I'aide du sys- 
teme Gigagoldlll (Stratagene), on melange ensuite les phages avec des Escherichia coli XL1 Blue (Stratagene) selon 
les recommandations du fournisseur, puis on etale le melange sur botte de Petri. On analyse ensuite les plaques 
recombinantes par hybridation de leur ADN transf6r6 sur une membrane Hybond-N (Amersham Life Sciences, UK) 
avec les fragments de 1kb et 4kb pr6alablement rendus radioactifs (kit Random Primed DNA Labeling, Boehringer- 
Manheim). 

Parmi 3000 plaques recombinantes, on a pu seiectionner par hybridation environ 20 plaques positives, desquelles 
on a ensuite isoie les vecteurs X-ZAP Express, puis excise les vecteurs pCMV renfermant un insert chromosomique 
(voir les recommandations du fournisseur Stratagene). Ces vecteurs recombinants sont appeies dans la suite des 
exemples "pFS". 

On a ensuite sequence les inserts chromosomiques de 1 1 vecteurs pFS (kit f-mol® DNA Sequencing System), k 
savoir les vecteurs pFS14, pFS15, pFS26. pFS30, pFS33, pFS49, pFS50, pFS65, pFS73, pFS80 et pFS86 (voir figure 
1.B) qui comprennent respectivement des fragments correspondant aux nucleotides de la sequence SEQ ID NO:1, 
9314-14602, 1-3159, 7988-11253, 1702-7991, 1361-7229, 4400-8477, 648-7676, 5997-11253, 8474-13489, 3550- 
7229, et 648-1 702. 

En recoupant les sequences nucieiques des differents inserts chromosomiques, on a pu ainsi caracteriser une 
sequence de 1 5,2kb correspondant au locus A de la souche Sfi6 (voir figure 1 .A). Les nucleotides 648 k 1 5250 de cette 
sequence de 15.2kb sont representes dans la sequence SEQ ID NO:1 . 
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I.7. Analyse de la sequence SEQ ID N0:1 : 

La sequence SEQ ID N0:1 comprend la totality de I'operon eps de la souche Sfi6. Cette sequence comprend 13 
ORFs complets, dans la m§me orientation, que Ton appelle eps A, B, C, D, E, F, G, H, /, J, K, L, M (voir figure 1 .A). Cette 
sequence comprend en outre 1 ORF complet & rextremite 3' de la sequence, qui est code par le brin compiementaire. 
Cet ORF, appelie orfZ, marque probablement la fin de l'op6ron du fait de son orientation inverse par rapport aux autres 
ORFs. 

La comparaison des sequences en acides amines cod6es par les 1 3 premiers ORFs avec celles de prolines pr6- 
sentes dans la banque de donn6e Swiss-Prot, & I'aide des logiciels FASTA, PEPPLOT et PILEUP de GCG-softwear, 
Wisconsin, USA, permet de deduire la fonction des 1 3 prolines codees par I'operon eps. Les r6sultats sont presentes 
ci-apres. 

L'ORF epsA (nucleotides 352-1803) code pour une proteine EpsA (SEQ ID NO:2) ayant 26,4% d'identite avec la 
proline LytR de Bacillus subtilis qui est impliquee dans la regulation de I'autolysine /V-acetylmuramoyl-L-alanine 
(Lazaveric et a/., J. Gen. Microbiol., 1949-1961, 1992). EpsA est done probablement une proline de regulation 
de I'operon eps. Par ailleurs, puisqu'un ORF de regulation d'un op6ron est g6neralement trouve en amont des autres 
ORFs, le gene epsA est probablement le premier gene de I'operon eps. Ceci est cortfirme par le fait qu'un terminateur 
est trouve aux nucleotides 230-252, un promoteur aux nucleotides 274-302, et un site d'attachement des ribosomes 
aux nucleotides 340-345 de la sequence SEQ ID NO:1. 

Le gene epsB (nucleotides 1807-2535) code pour une protein e EpsB (SEQ ID NO:3) ayant 67,5% d'identite avec 
la proteine CpsA de Streptococcus agalactiae et 30% d'identite avec la proteine CapC de Staphylococcus aureus 
(Rubens etal., Mol. Microbiol., 8, 843-885, 1993; Un era/., J. BacterioL 176. 7005-7016, 1994). La fonction precise de 
ces genes est encore inconnue, en dehors du fait qu'ils sont essentiels pour ia synthase de la capsule qui est constituee 
de polysaccharides accroches aux phospholipides de la membrane externe des bacteries. 

Le gene epsC (nucleotides 2547-3239) code pour une proteine EpsC (SEQ ID NO:4) ayant 52% d'identite avec la 
proteine CpsB de Streptococcus agalactiae qui est impliquee dans la synthese de la capsule (Rubens ef a/.). EpsC a 
aussi 23% d'identite, 49% de similarity, et un prof il d'hydrophobicite comparable £ celui des proteines CLD de Salmo- 
nella typhimurium, Salmonella enterica et Escherichia coli (Batch elor era/., J. Bacterid., 174, 5228-5236, 1992; Bastin 
et a/., Mol. Microbiol., 7, 725-734, 1993). II faut remarquer que les proteines CLD sont impliqu6es dans le contrdle de 
la longeur des chaTnes de polysaccharides lors de leur biosynthese. 

Le gene epsD (nucleotides 3249-3995) code pour une proteine EpsD (SEQ ID NO:5) ayant 60,5% d'identite avec 
la proteine CpsC de Streptococcus agalactiae, ayant 34,5% d'identite avec la proteine CapA de Staphylococcus 
aureus, et ayant 33% d'identite avec la proteine ExoP de Rhizobium meliloti (Rubens et a/.; Lin er a/.; Becker et a/., 
Mol. Gen. Genet, 241, 367-379, 1993). La proteine ExoP est une proteine de membrane qui est impliquee dans la 
translocation d'EPS et/ou de pr6curseurs d'EPS. 

Le gene epsE (nucleotides 4051-4731) code pour une proteine EpsE (SEQ ID NO:6) presentant des homologies 
signrf icatives avec de nombreuses proteines ayant une activite galactosyl-transferase (Rubens ef a/.). Ce gene code 
done probablement pour une galactosyl-transferase. 

On peut remarquer que les genes epsB, C, D, E de S. thermophifus Sfi6 sont similaires & ceux de I'operon de S. 
agalactiae comprenant les genes epsA, B, C, D (Rubens et a/.). De plus, ils sont organises de la m§me fagon. Bien que 
les polysaccharides de capsule et I'EPS des deux souches soient tres diff6rents, ceci indique qu'une region chromoso- 
mique a ete probablement tranferee entre ces deux especes. 

Le gene epsF (nucleotides 4898-5854) code pour une proteine EpsF (SEQ ID NO:7) ayant respectivement 24,5% 
et 23% d'identite avec les proteines CapH et CapM de S. mutans qui sont impliqu6es probablement en tant que glyco- 
syl-transf6rases dans la biosynthese de la capsule (Lin et a/.). 

Le gene epsG (nucleotides 6425-7540) code pour une proteine EpsG (SEQ ID NO:8) ayant 20,5% d'identite et 
50% de similarite avec la N-acetylglucoseamine-transferase de Salmonella tryphimurium LT2 qui est impliquee dans la 
biosynthese du polysaccharide LPSde la membrane externe (Mac Lachlan etaL, J. BacterioL, 173. 7151-7163, 1991). 
Du fait qu'une A/-ac6tylglucosamine n'est pas impliquee dans la biosynthese de I'EPS de la souche Sfi6 (il n'y a pas de 
glucose acetyie), le gene epsG code probablement pour une glucosyl-transf erase, une A/-acetylgalactosyl-transf6rase, 
ou une A/-ac6tylglucosyl-transf6rase ayant une activite A/-ac6tylglucosamine-epimerase. 

Le gene epsH (nucleotides 7736-8212) code pour une proteine EpsH (SEQ ID NO:9) ayant de fortes homologies 
avec des acetyl-transferases NodL-LacA-CysE (Downie era/., Mol. Microbiol, 2, 1649-1651, 1989). De ce fait la pro- 
teine EpsH pourrait §tre une acetyl -transferase impliquee dans la biosynthese de la N-acetylgalactoseamine de I'EPS. 

Le gene epsf (nucleotides 8221 -9192) code pour une proteine Epsl (SEQ ID NO:10) ayant 24% d'identite avec une 
proteine, cod6e par un I'ORF RfbV du cluster rib de Salmonella typhimurium, qui est probablement une glycosyl-trans- 
f6rase (Jiang era/.; Uu etaL, J. BacterioL, 17Z, 4084-4088, 1995). 

Le gene epsJ (nucleotides 9285-10364) code pour une proteine EpsJ (SEQ ID NO:1 1) ayant 20% d'identite et un. 
profil d'hydrophobicite comparable e celui d'une proteine d'un ORF du cluster rib de Salmonella enterica qui est lui- 
m§me similaire & une polymerase de I'antigene O des salmonelles du groupe B et C2 (Lee et a/., J. Gen, Microbiol., 
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138. 1843-1855, 1992; Morona et a/., J. Bacteriol. 176, 733-747, 1994). Le gene epsJ pourrait done coder une EPS- 
polymerase qui polymeriserait I'unite tetrasaccharide de I'EPS. 

Le gene epsK (nucleotides 10392-1 1339) code pour une proteine EpsK (SEQ ID NO:12) ayarrt 18% d'identite et 
42% de similarity avec la proteine, codee par le gene lipB de Neisseria meningitidis, qui est impliquee dans ia biosyn- 
these de la capsule en accrochant des polysaccharides aux phospholipides de la membrane externe (Frosch et a/., 
MoL Microbiol., 8, 483-493, 1993). Sachant que les S. thermophilus n'ont pas de membrane externe (Gram-positif), le 
gene epsK pourrait done coder une enzyme impliquee dans I'accrochage des EPS aux phospholipides de la membrane 
cellulaire. qui de concert avec un transporteur d'EPS (probabiement EpsC et EpsD) et une enzyme qui detache les 
EPS, participerart au transport de I'EPS k travers la membrane (modele en accord avec celui presente par Frosch et 
a/.). 

Par ailleurs, on peut remarquer que le transposon Tn916 est integr6 dans le gene epsKdu mutant n°1 utilise pour 
identifier I'operon eps (voir le point I.6 ci-dessus), entre les nucleotides 10540-10541 de la sequence SEQ ID NO:1 . 

Le gene epsL (nucleotidesi 1302-12222) code pour une proteine EpsL (SEQ ID NO:14) qui ne presente aucune 
homologie avec des proteines connues. Les 38 premiers nucleotides sont couverts par I'extremite 3' de epsK, ce qui 
laisse supposer une expression coordonnee des deux proteines, et une activite de la proteine EpsL dans le transport 
membranaire de TEPS. 

Le gene epsM (nucleotides 12233-13651) code pour une proteine EpsM (SEQ ID NO:13) qui ne presente aucune 
homologie avec des proteines connues de la banque de donnees Swiss-prot. Ce gene est certainement implique dans 
la biosynthese de PEPS de la souche Sfi6 car il n'y a pas, en amont, un promoteur'specif ique pour ce gene. 

Le gene orfZ (13732-14305 sur le brin complementaire) est present en orientation inverse par rapport au reste des 
ORFs de I'operon eps. De ce fait, il n'est probabiement pas implique dans la biosynthese de I'EPS de la souche Sfi6. 
De plus, il ne presente aucune homologie avec des proteines connues de la banque de donnees Swiss-prot. 

En conclusion, les inserts chromosomiques isoles des 1 1 vecteurs pSF (voir le point I.6 ci-dessus) couvrent une 
region chromosomique de la souche S. thermophilus Sfi6 qui est manifestement impliquee dans la biosynthese de 
I'EPS. On a pu ainsi identifier 1 3 genes complets qui comprennent en amont un promoteur delimitant le debut de I'ope- 
ron eps. 

Exemp le. II: inactivatiQn du gfene epsJ 

On inactive par recombinaison homologue le gene epsJ de I'operon eps pour confirmer son importance dans la 
biosynthese de I'EPS. 

Pour cela, on isole un fragment Dra\-Sal\ du plasmide pGEMT renfermant le fragment de PCR de 0.8 kb (voir 
rexemple I.6 ci-dessus), on le ligue dans le plasmide thermosensible pSA3 (Dao et a/., Appl. Environ. Microbiol., 49, 
115-119, 1985) prealablement digere par EcoRV et Sa/I, on transfbrme la souche E. cofi XL1 -blue par le produit de 
ligation, on selectionne des transformants, on isole un plasmide recombinant, puis on transfbrme par electroporation la 
souche S. thermophilus Sfi6 avec le plasmide recombinant au moyen d'une methode adaptee de celle decrite par Slos 
et at. (Appl. Environ. Microbiol., 57. 1333-1339, 1991). On resuspend les cellules soumises k une decharge de 2,1kV, 
25^F et 400Q dans 1ml de milieu HJL que Ton incube 4h k 37°C (temperature permissive), on etale les cellules sur un 
milieu solide LM1 7 supplemente de 2,5jig/ml d'erythromycine que Ton incube 16h k 37°C, puis on selectionne les colo- 
nies transformees qui survivent. On incube ensuite les colonies selectionnees dans 2 ml de milieu HJL supplemente 
de 2,5jig/ml d 'erythromycin jusqu'& ce que la densite optique k 600nm (DO 600 ) de la culture att eigne 0,2, on soumet la 
culture k 45°C jusqu'& ce que la DO 600 atteigne 1 .0 (le plasmide ne se replique plus), puis on etale des dilutions de la 
culture sur un milieu LM1 7 solide supplemente de 2,5jig/ml d'erythromycine que I'on incube 12h k 45°C. 

Les colonies qui survivent ont integre dans le gene epsJ le plasmide pSA3 recombinant. Ceci peut §tre verif ie par 
Southern-Blot d'une preparation d'ADN chromosomique des colonies survivantes digeree par EcoRI (coupe une seule 
fois dans pSA3), et hybridation du filtre de Southern-Blot avec le fragment radioactif precite Dra\-Sal\. Les colonies 
ayant integre le plasmide pSA3 presentent deux bandes sur le filtre de Southern- Blot. De plus, les colonies ayant inte- 
gre dans eps J le plasmide pSA3 recombinant presentent un phenotype EPS(-) sur un milieu solide Rouge de Ruthe- 
nium, et ont perdu leur caractere filant dans un lait MSK (voir I'exemple 1. 4 ci-dessus). 

Exemple III: inactivation des genes eps A, B, Q, D, E, £ G t H, /, K, L, M 

On a montre aux exemples I et II que Tinactivation des genes epsK et eps J, par insertion d'un transposon ou d'un 
plasmide integratif, intenompt la biosynthese d'EPS dans la souche Sf i6. 

De meme, on peut inactiver par recombinaison homologue les autres genes de I'operon eps de la souche Sf i6, et 
observer ainsi une interruption de la biosynthese d'EPS. Pour cela, on ampiif i par PCR un fragment d'un ORF prov - 
nant d'un des 1 1 vecteurs pFS decrits & I'exemple I.6 ci-dessus. On le clone dans le plasmide pSA3, puis on le trans- 
forme et on I'integre k la souche Sfi6 dans les memes conditions que celles decrites k I'exemple precedent. 
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Exemple IV: restauration de la production d'EPS 

On coupe par EcoRI pFS30, on separe les fragments, on ligue le fragment de 5.5 kb k pFS1 4 prealablement digere 
par EcoR\, on transforme des cellules XL1-blue par le produit de ligation, on s6lectionne des clones transform^ pr6- 
sentant une bonne orientation des inserts, on isole un plasmide appelie pFS30-14, on ligue un fragment EcoRI central 
de pFS65 k pFS30-14 prealablement coupe par EcoRI, on transforme des cellules XL1 -blue par le produit de ligation, 
puis on seiectionne des clones transferrins pr6sentant une bonne orientation des inserts. Le plasmide recombinant 
resultant, appelie pFS30-65-14, comprend les nucleotides 1 702 k 14602 de la sequence SEQ ID NO:1. 

On coupe ensuite pFS30-65-14 par Sa/I et Smal on separe le fragment de 12.9 kb, on le ligue k pSA3 prealable- 
ment coupe par EcoRV et Sa/I, on transforme des cellules XL1-blue par le produit de ligation, on seiectionne des clo- 
nes transform6s, et on isole des plasmides pSA3 recombinants. 

On transforme par eiectroporation la souche S. thermophilus CNCM 1-1292 d6pos6e le 29 mars 1993 par les plas- 
mides pSA3 recombinants. Cette souche Gram-positive pr§sente au microscope un aspect de coques non f lageliees 
formant des chaTnettes, elle ne fait pas de spores, elle est ana6orobe facultative, elle ne produit pas d'EPS, et elle pre- 
sente dans son genome 1000 pb correspondant a I'extremite 5' de I'operon eps. Le plasmide pSA3 recombinant peut 
done s'integrer dans le genome de la souche CNCM 1-1292. Certains des clones transform6s pr6sentent un phenotype 
EPS(+) sur un milieu solide Rouge de Ruthenium, et un caractere f ilant dans un lait MSK. 

Exemple V restauration de la production d'EPS 

On digere le chromosome de la souche Sfi6 par des enzymes qui ne coupent pas dans la sequence SEQ ID NO:1 
(BarnHl, Sa/I, Nru\, Stu\), on separe le produit de digestion sur un gel d'agarose, on eiue les bandes de 15-25 kb, on 
les ligne dans pSA3 prealablement coupe par une enzyme de restriction approprtee, on transforme par eiectroporation 
la souche S. thermophilus CNCM 1-1292, puis on seiectionne des transformants par transferts des colonies sur un filtre 
suivi d'une hybridation de leur ADN avec I'insert de pFS14 rendu prealablement radioactrf. Certains des clones trans- 
formes pr6sentent un ph6notype EPS(+) sur un milieu solide Rouge de Ruthenium, et un caractere filant dans un lait 
MSK. 

Exemole VI modification d'un EPS 

On transforme par eiectroporation la souche S. thermophilus CNCM 1-1422, d6pos6e le 18 mai 1994, par le plas- 
mide pSA3 recombinant de Pexemple V. Cette souche Gram-positive pr6sente au microscope un aspect de coques non 
flageliees formant des chaTnettes, elle ne fait pas de spores, elle est anaeorobe facultative, et elle produit un EPS ayant 
la composition Glc:Gal=2:2. 

Exemple VII modification d'un EPS 

On transforme par eiectroporation la souche S. thermophilus CNCM 1-1351, d6pos6e le 5 aoQt 1993, par le plas- 
mide pSA3 recombinant de I'exemple V. Cette souche Gram-positive pr6sente au microscope un aspect de coques non 
flageliees formant des chaTnettes, elle ne fait pas de spores, elle est anaeorobe facultative, et elle produit un EPS ayant 
la composition Glc:Gal:Rha= 1:3:2 

Exemple VIII modification d'un EPS 

On isole de I'ADN chromosomique de la souche CNCM 1-1590 par le methode de Slos etai (Appl. Environ. Micro- 
biol., 57, 1333-1339, 1991). On digere la preparation d'ADN par Sacl et SamHI, on separe les fragments d'ADN par 
eiectrophorese sur gel d'agarose 0,7%, on eiue les fragments de 1 2 k 1 6kb, on ligue I'ADN extrait au vecteur pJIM2279 
(obtenu de P. Renault, INRA, Jouy-en-Josas, Paris, France) prealablement dig6r6 par Sacl et BamH\ puis dephospho- 
ryie. On transforme la souche Lactococcus lactis MG1363 (J. Bacterid., 154, 1-9, 1983), cultiv6e sur milieu GM17 k 
30°C, par la methode de De Vos etal. (Gene, 85, 169-176, 1989). On seiectionne les clones transform6s par hybrida- 
tion du DNA genomique des clones avec I'une des sondes ayant la sequence SEQ ID NO: 15, 16, 17, 18 et 19. Parmi 
400 transformants, 6 clones positifs sont s6lectionn£s, dont 1 comprend un plasmide appeie pFS101 represents k la 
figure 1.C. 

Pour determiner si le plasmide pFS101 est capable d'induire la production d'EPS recombinant, L lactis MG1363 
est retransforme par pFS101 , et directement 6tal6 sur le milieu solide rouge de ruthenium. A titre de comparison, L 
lactis MG1363 est transforme par le plasmide pJIM2279 puis est directement etaie sur le milieu solide rouge de ruthe- 
nium Les resultats montrent que toutes les colonies comprenant pJIM2279 ont un ph6notype rouge (3000 colonies 
Ep S(-)), tandis que plus de 99,5% des colonies comprenant pFS101 ont un ph6notype blanc (800 colonies EPS(+), k 
I'exception de 2 colonies). La souche L lactis MG1363 transforme par pFSl01 produit done un EPS recombinant. 
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On fait produire TEPS de la souche L lactis MG1 363 transformee par pFS101 , en la cultivant dans le milieu MAM, 
a un pH de 5.5, a 30°C sous agitation magnetique de 60 rotation par minute. On isole I'EPS recombinant en metan- 
geant le milieu de culture & 40% d'acide trichloro-acetique, en centrifugeant le melange 20 min a 8000g, en meiangeant 
un volume egal d'acetone au precipite, en incubant le tout a 4°C pendant 12h, en precipitant le melange & 10000g pen- 

5 dant 1 h, en mettant en suspension le pr6ciprt6 dans de I'eau, en ajustant le pH du melange a 7, en le dialysant centre 
de Peau pendant 24h, en I'ultracentrifugeant a 100000g pendant 1h, en r§cup§rarrt le surnageant. puis en lyophilisant 
le surnageant. A titre de comparaison, on cultive la souche L lactis MG1363 transformee par pJIM2279 dans les 
m§mes conditions et on isole les sucres de la m§me manure. 

On determine la quantity de sucres neutres totaux par la methode de Dubois et al. (Anal. Chem., 28, 350-356, 

10 1956). Les resultats montrent que la souche transformee par pFS101 produit 10mg/l de sucres, exprim£ en glucose 
Equivalent, tandis la souche transformee par pj IM2279 produit des traces de sucre (< 1 mg/l). 

On estime le poids moieclaire de I'EPS recombinant par chromatographic sur une colonne de gel-filtration Supe- 
rose-6 (Pharmacia) qui est connect6e au systeme FPLC (Pharmacia) prSalablement calibre avec du dextran commer- 
cial (Sigma) de 2x10 s a 5x10 3 Dalton (Da). Pour cela, on depose sur la colonne 0,25 & 1ml d'un echantillon comprenant 

is 250jig de sucres neutres, on l'6lue par un flux de Q,5ml/min dans un tampon phophate 50mM pH7,2. Pour comparai- 
son, de la m&me maniere on s£pare les sucres produrts par la souche transformee par pJIM2279. Les resultats pr6- 
sentes a la figure 2 montrent que la souche transformee par pJIM2279 produit une petite quantfte de polysaccharides 
heterogenes ayant certainement pour origine la paroi cellulaire (2-0,5x10 6 Da; fractions 8-15) et une grande quantite 
d'oligosaccharides de petits poids moieculaires (mono- et di -saccharides; fractions 20-22). Par contre, la souche trans- 

20 fbrm6e par pFS1 01 pr6sente manifestement un EPS recombinant de haut poids moieculaire d'environ 2x1 0 6 Da (frac- 
tion 9). 

On determine la composition en sucres de I'EPS recombinant par chromatographie en phase gazeuse par la 
methode de Neeser et al. (Anal. Biochem., 142, 58-67, 1 984). Les resultats montrent que le milieu de culture de la sou- 
che transformee par pFS101 comprend en molarite un ratio 1 :3 de G!c:Gal. On peut detecter des traces de rhamnose 
25 issues de la paroi cellulaire. Par contre, on ne detecte pas de GalNac. 

La composition de I'EPS produit par la souche L lactis MG1363 transformee par pFS101 est done diff6rente de 
celle de I'EPS produit par la souche S. thermophilus CNCM 1-1590. On peut raisonnablement estimer que la structure 
de I'EPS recombinant est la m§me que celle de I'EPS de la souche CNCM 1-1590, & la difference pr£s que le GalNac 
est remplace par un galactose. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 
(i) DEPOSANT: 

(A) NOM: SOCIETE DES PRODUITS NESTLE 

(B) RUE: AVENUE NESTLE 55 

(C) VILLE: VEVEY 

(D) ETAT OU PROVINCE: CANTON DB VAUD 

(E) PAYS: SUISSE 

(F) CODE POSTAL: 1800 

(G) TELEPHONE: {41) 21 924 4760 

(H) TELECOPIE: (41) 21 924 2880 

(ii) TITRE DE L' INVENTION: BACTERIES LACTIQUES PRODUISANT DES EPS 
(iii) NOMBRE DE SEQUENCES: 19 
(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C> SYSTEME D' EXPLOITATION: PC - DOS /MS - DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 14602 pa ires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: ADN (g,nomique) 
(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 352. .1803 

(D) AUTRES INFORMATIONS : /products "epsA" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1807. .2535 

(D) AUTRES INFORMATIONS : /products* "epsB" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 2 54 7. .3239 

(D) AUTRES INFORMATIONS : /products "epsC" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 3249. .3995 

(D) AUTRES INFORMATIONS : /products "epsD" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 4051. .4731 

(D) AUTRES INFORMATIONS : /product= "epsE" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 4898. .5854 

(D) AUTRES INFORMATIONS : /products "epsF" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 64 2 5. .7540 

(D) AUTRES INFORMATIONS : /products "epsG" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 7736. .8212 

(D) AUTRES INFORMATIONS : /products "epsH" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 8221 . . 9192 

(D) AUTRES INFORMATIONS: /products "epsl" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 9285. .10364 

(D) AUTRES INFORMATIONS : /products "epsJ" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 10392 . .11339 

(D) AUTRES INFORMATIONS : /products "epsK" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: misc feature 

(B) EMPLACEMENT: 113 02. .12222 
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(D) AUTRE S INFORMATIONS : /product = "CDS (epsL) recouvrant le 
CDS aux nucleotides 10392-11339" 
(ix) CARACTERISTIQUE: 
(A) NOM/CLE: CDS 
5 (B) EMPLACEMENT: 12233. .13651 

(D) AUTRE S INFORMATIONS : /products "epsM" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: misc feature 
<B) EMPLACEMENT :lT732. .14305 

(D) AUTRES INFORMATIONS :/function= "cadre de lecture 
ouverte porte par le brin complement a ire" 
/product = 11 or f 2" 
W (ix) CARACTERISTIQUE: 

(A) NOM/CLE: terminator 

(B) EMPLACEMENT: 230. .252 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: promoter 

(B) EMPLACEMENT: 2 74. .302 
(ix) CARACTERISTIQUE: 

75 (A) NOM/CLE: RBS 

(B) EMPLACEMENT: 340. .345 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

TAGTTTGTAA AAGGACGCCA TTTGGTCGTC CTTTTGTGTT GTAGCTAATA TCTGTTCGAA 60 

20 GTGATAATAA GTTAAAATTT TTCAAACTAC TAGAAAAAAT AAAAATATTT GGAAGAAGAA 120 

GACTTATAAT AAATAGGTAA ATATCTGACA ATTTAAAGTT TAACTACTAA AAATGTAAAA 180 

GATAGTTCAC AATATAATGG AAAATGATAT AAATTAAATG ATTGATATCA TAATGAAAAA 240 

CGTTTTCTTA TTTTTTTGAA AAAAGAATGA CAATTGAAAT GAGGTTGTAT TAATGTTATA 300 

25 ATAATAATAA TAATGGGGAA TACCTAATTT TAATTTTTAG GAGCAATTTA T ATG AGT 357 

Met Ser 
1 

TCG CGT ACG AAT CGT AAG CAA AAG CAT ACG AGT AAT GGA TCG TGG GGG 405 
Ser Arg Thr Asn Arg Lys Gin Lys His Thr Ser Asn Gly Ser Trp Gly 
5 10 15 

ATG GTC AAC GTT GGG TTG ACC ATC CTG TAT GCT ATT TTA GCA TTG GTC 453 
Met Val Asn Val Gly Leu Thr lie Leu Tyr Ala He Leu Ala Leu Val 
20 25 30 

TTA TTA TTC ACC ATG TTC AAT TAT AAT TTC CTA TCC TTT AGG TTT TTG 501 
Leu Leu Phe Thr Met Phe Asn Tyr Asn Phe Leu Ser Phe Arg Phe Leu 
35 40 45 50 

AAC ATC ATT ATC ACC ATT GGT TTG TTG GTA GTT CTT GCT ATT AGC ATC 549 
Asn He He He Thr He Gly Leu Leu Val Val Leu Ala He Ser He 
55 60 65 

TTC CTT CAG AAG ACT AAG AAA TTA CCA CTA GTG ACA ACG GTT GTA CTG 597 
Phe Leu Gin Lys Thr Lys Lys Leu Pro Leu Val Thr Thr Val Val Leu 
40 70 75 80 

GTT ATC TTC TCG CTA GTT TCT CTG GTT GGT ATT TTT GGT TTT AAA CAA 645 
Val He Phe Ser Leu Val Ser Leu Val Gly He Phe Gly Phe Lys Gin 
85 90 95 
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45 



ATG ATT GAC ATC ACT AAC CGT ATG AAT CAG ACA GCA GCA TTT TCT GAA 693 
Met He Asp He Thr Asn Arg Met Asn Gin Thr Ala Ala Phe Ser Glu 
100 105 110 

GTA GAA ATG AGC ATC GTG GTT CCT AAG GAA AGT GAC ATC AAA GAT GTG 741 
Val Glu Met Ser He Val Val Pro Lys Glu Ser Asp He Lys Asp Val 
115 120 125 130 

AGC CAG CTT ACT AGC GTA CAG GCA CCT ACT AAG GTT GAT AAG AAC AAT 789 
50 Ser Gin Leu Thr Ser Val Gin Ala Pro Thr Lys Val Asp Lys Asn Asn 

135 140 145 

ATC GAG ATC TTG ATG TCA GCT CTC AAA AAA GAT AAA AAA GTT GAT GTT 837 
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lie Glu lie Leu Met Ser Ala Leu Lys Lys Asp Lys Lys Val Asp Val 
150 155 160 

AAA GTT GAT GAT GTT GCC TCA TAT CAA GAA GCT TAT GAT AAT CTC AAG 885 
Lys Val Asp Asp Val Ala Ser Tyr Gin Glu Ala Tyr Asp Asn Leu Lys 
165 170 175 

TCT GGC AAA TCT AAA GCT ATQ GTC TTG AGT GGC TCT TAT GCT AGC CTA 933 
Ser Gly Lys Ser Lys Ala Met Val Leu Ser Gly Ser Tyr Ala Ser Leu 
180 185 190 

TTA GAG TCT GTC GAT AGT AAT TAT GCT TCA AAT CTA AAA ACA ATT TAT 981 
Leu Glu Ser Val Asp Ser Asn Tyr Ala Ser Asn Leu Lys Thr lie Tyr 
195 200 205 210 

ACT TAT AAA ATT AAA AAG AAG AAT AGC AAC TCT GCA AAC CAA GTA GAT 1029 
Thr Tyr Lys He Lys Lys Lys Asn Ser Asn Ser Ala Asn Gin Val Asp 
215 220 225 

15 TCA AGA GTC TTC AAT ATT TAT ATT AGT GGT ATT GAT ACC TAC GGT CCG 1077 

Ser Arg Val Phe Asn He Tyr He Ser Gly He Asp Thr Tyr Gly Pro 
230 235 240 

ATT TCA ACA GTG TCA CGT TCA GAT GTC AAT ATC ATT ATG ACA GTA AAC 1125 
He Ser Thr Val Ser Arg Ser Asp Val Asn He He Met Thr Val Asn 
245 250 255 

20 ATG AAT ACA CAT AAG ATT CTC TTG ACG ACT ACT CCA CGT GAT GCA TAC 1173 

Met Asn Thr His Lys He Leu Leu Thr Thr Thr Pro Arg Asp Ala Tyr 
260 265 270 

GTT AAG ATT CCT GGT GGT GGG GCA GAC CAG TAT GAT AAA TTA ACC CAC 1221 
Val Lys He Pro Gly Gly Gly Ala Asp Gin Tyr Asp Lys Leu Thr His 
275 280 285 290 

25 

GCA GGT ATT TAT GGC GTT GAA ACA TCT GAA CAA ACT CTA GAA GAT CTT 1269 
Ala Gly He Tyr Gly Val Glu Thr Ser Glu Gin Thr Leu Glu Asp Leu 
295 3.00 305 

TAT GGT ATT AAG CTT GAT TAC TAT GCA CGA ATT AAC TTC ACA TCT TTC 1317 
Tyr Gly He Lys Leu Asp Tyr Tyr Ala Arg He Asn Phe Thr Ser Phe 
3Q 310 315 320 

CTT AAG TTG ATT GAC CAA CTT GGT GGT GTG ACA GTC CAT AAT GAT CAA 1365 
Leu Lys Leu He Asp Gin Leu Gly Gly Val Thr Val His Asn Asp Gin 
325 330 335 

GCT TTC ACA CAA GAG AAG TTT GAT TTC CCG GTT GGA GAT ATC CAA ATG 1413 
Ala Phe Thr Gin Glu Lys Phe Asp Phe Pro Val Gly Asp He Gin Met 
35 340 345 350 

AAT TCA GAG CAA GCA CTT GGA TTT GTT CGT GAA CGC TAT AAT TTA GAT 1461 
Asn Ser Glu Gin Ala Leu Gly Phe Val Arg Glu Arg Tyr Asn Leu Asp 
355 360 365 370 



40 



GGC GGA GAT AAT GAC CGT GGT AAA AAC CAG GAG AAA GTT ATT TCT GCG 1509 
Gly Gly Asp Asn Asp Arg Gly Lys Asn Gin Glu Lys Val He Ser Ala 
375 380 385 

ATT TTA AAC AAG TTG GCT TCT CTA AAA TCT GTA TCA AAC TTT ACT TCA 1557 
He Leu Asn Lys Leu Ala Ser Leu Lys Ser Val Ser Asn Phe Thr Ser 
390 395 400 

ATC GTT AAT AAT CTC CAA GAC TCT GTC CAA ACG AAT ATG TCT TTG AAT 1605 
45 He Val Asn Asn Leu Gin Asp Ser Val Gin Thr Asn Met Ser Leu Asn 

405 410 415 

ACC ATT AAC GCT TTG GCT AAT ACA CAA CTT GAA TCA GGT TCT AAA TTT 1653 
Thr He Asn Ala Leu Ala Asn Thr Gin Leu Glu Ser Gly Ser Lys Phe 
420 425 430 



50 



55 



ACG GTG ACT TCT CAA GCA GTA ACA GGT ACA GGT TCA ACC GGA CAA TTG 1701 
Thr Val Thr Ser Gin Ala Val Thr Gly Thr Gly Ser Thr Gly Gin Leu 
435 440 445 450 
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ATC TCT TAT GCG ATG CCA AAT TCT AGT CTT TAC ATG ATG AAA CTA GAT 1749 
lie Ser Tyr Ala Met Pro Asn Ser Ser Leu Tyr Met Met Lys Leu Asp 
455 460 465 

AAT TCG AGT GTG GAA AGT GCC TCT CAA GCT ATC AAA AAA TTG ATG GAG 1797 
Asn Ser Ser Val Glu Ser Ala Ser Gin Ala lie Lys Lys Leu Met Glu 
470 475 480 

GAA AAA TAA GTG ATT GAC GTT CAC TCA CAT ATT GTT TTT GAT GTT GAT 1845 
Glu Lys Val lie Asp Val His Ser His He Val Phe Asp Val Asp 
15 10 

GAT GGT CCT GAA ACT TTA GAA GAA AGT TTA GAC CTC ATT GGT GAA AGT 1893 
Asp Gly Pro Glu Thr Leu Glu Glu Ser Leu Asp Leu He Gly Glu Ser 
15 20 25 

TAC GCC CAG GGG GTA CGT AAG ATT GTT TCA ACA TCC CAT CGT CGT AAG 1941 
Tyr Ala Gin Gly Val Arg Lys He Val Ser Thr Ser His Arg Arg Lys 
30 35 40 45 

GGG ATG TTT GAG ACT CCA GAG GAT AAA ATT TTT GCC AAC TTT AAA AAA 1989 
Gly Met Phe Glu Thr Pro Glu Asp Lys He Phe Ala Asn Phe Lys Lys 
50 55 60 

GTA AAA GCA GAA GCA GAA GCA CTT TAT CCA GAC TTA ACT ATT TAT TAT 2037 
Val Lys Ala Glu Ala Glu Ala Leu Tyr Pro Asp Leu Thr He Tyr Tyr 
20 65 70 75 

GGA GGT GAA CTT TAT TAC ACC TCA GAC ATT GTG GAG AAA CTT GAA AAG 2085 
Gly Gly Glu Leu Tyr Tyr Thr Ser Asp He Val Glu Lys Leu Glu Lys 
80 85 90 

AAT CTC ATT CCG CGC ATG CAC AAC ACT CAA TTT GCT TTA ATT GAG TTT 2133 
__ Asn Leu He Pro Arg Met His Asn Thr Gin Phe Ala Leu lie Glu Phe 

25 95 100 105 

AGT GCT CGC ACA TCT TGG AAA GAA ATT CAT AGT GGG CTT AGT AAT GTT 2181 
Ser Ala Arg Thr Ser Trp Lys Glu He His Ser Gly Leu Ser Asn Val 
110 115 120 125 

TTG AGA GCG GGG GTA ACG CCT ATT GTT GCT CAT ATT GAG CGC TAT GAT 2229 
30 Leu Arg Ala Gly Val Thr Pro He Val Ala His He Glu Arg Tyr Asp 

130 135 140 

GCC CTC GAA GAA AAT GCT GAC CGT GTT CGA GAA ATC ATC AAT ATG GGC 2277 
Ala Leu Glu Glu Asn Ala Asp Arg Val Arg Glu He He Asn Met Gly 
145 150 155 



35 



TGC TAT ACT CAA GTC AAT AGC TCA CAT GTC CTC AAA CCA AAG CTC TTT 2325 
Cys Tyr Thr Gin Val Asn Ser Ser His Val Leu Lys Pro Lys Leu Phe 
160 165 170 

GGA GAT AAA GAT AAA GTA AGA AAG AAA CGT GTT CGC TTT TTC TTG GAG 2373 
Gly Asp Lys Asp Lys Val Arg Lya Lys Arg Val Arg Phe Phe Leu Glu 
175 180 185 

40 AAA AAT TTG GTT CAT ATG GTT GCT AGC GAC ATG CAT AAT CTT GGG CCG 2421 

Lys Asn Leu Val His Met Val Ala Ser Asp Met His Asn Leu Gly Pro 
190 195 200 205 

AGA CCA CCA TTT ATG AAA GAT GCT TAT GAA ATT GTT AAA AAG AAC TAC 2469 
Arg Pro Pro Phe Met Lys Asp Ala Tyr Glu He Val Lys Lys Asn Tyr 
210 215 220 



45 
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GGC TCC AAA CGT GCT AAG AAT CTT TTT ATT GAA AAT CCC AAA ACA TTA 2517 
Gly Ser Lys Arg Ala Lys Asn Leu Phe He Glu Asn Pro Lys Thr Leu 
225 230 235 

CTA GAA AAT CAA TAT TTA TAGGAGATAT T ATG AAT CAA GAT AAC ACT AAA 2567 
Leu Glu Asn Gin Tyr Leu Met Asn Gin Asp Asn Thr Lya 

240 1 5 

AGT GAT GAA ATC GAC GTA CTA GCA TTG CTA CAT AAA CTT TGG ACG AAG 2615 
Ser Asp Glu He Asp Val Leu Ala Leu Leu His Lys Leu Trp Thr Lys 
10 15 20 
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AAG CTT TTG ATT CTT TTC ACA GCT TTT TAT TTC GCT GTT TTC AGT TTC 2663 
Lys Leu Leu lie Leu Phe Thr Ala Phe Tyr Phe Ala Val Phe Ser Phe 
25 30 35 

s TTA GGT ACT TAT TTC TTT ATC CAA CCA ACA TAT ACA TCA ACA ACG CGT 2711 

Leu Gly Thr Tyr Phe Phe He Gin Pro Thr Tyr Thr Ser Thr Thr Arg 
40 45 50 55 

ATC TAT GTT GTT AAT CAG GCA ACA GAT AAT AAG AAT CTT TCT GCT CAA 2759 
He Tyr Val Val Asn Gin Ala Thr Asp Asn Lys Asn Leu Ser Ala Gin 
60 65 70 

10 GAT TTG CAA GCT GGT ACC TAT TTG GCA AAT GAC TAT AAA GAG ATT ATT 2807 

Asp Leu Gin Ala Gly Thr Tyr Leu Ala Asn Asp Tyr Lys Glu He He 
75 80 85 

GCA TCA AAT GAT GTA TTA TCA GAA GTT ATT AAA GAT GAA AAA TTG AAT 2855 
Ala Ser Asn Asp Val Leu Ser Glu Val lie Lys Asp Glu Lys Leu Asn 
90 95 * 100 

76 TTG AGT GAG GCA GAA CTG TCT AAA ATG GTT TCA GTT AAT ATT CCT ACT 2903 

Leu Ser Glu Ala Glu Leu Ser Lys Met Val Ser Val Asn He Pro Thr 
105 110 115 

GAT ACT CGT CTT ATT TCA ATT TCT GTT AAT GCT AAA ACT GGT CAA GAT 2951 

Asp Thr Arg Leu He Ser He Ser Val Asn Ala Lys Thr Gly Gin Asp 
120 ~ 125 130 135 

20 

GCG CAA ACA CTT GCC AAT AAG GTT CGT GAA GTT GCT TCA AAA AAA ATC 2999 

Ala Gin Thr Leu Ala Asn Lys Val Arg Glu Val Ala Ser Lys Lys He 
140 145 150 

AAG AAG GTG ACA AAA GTT GAA GAT GTC ACA ACG CTC GAA GAA GCT AAA 3047 
Lys Lys Val Thr Lys Val Glu Asp Val Thr Thr Leu Glu Glu Ala Lys 
25 155 160 165 

TTG CCA GAG TCA CCA TCT TCA CCA AAT ATC AAA CTT AAT GTG CTT CTT 3 095 

Leu Pro Glu Ser Pro Ser Ser Pro Asn He Lys Leu Asn Val Leu Leu 
170 175 180 



30 



GGG GCA GTG CTT GGA GGA TTC CTT GCA GTG GTT GGT GTA TTG GTA CGT 3143 
Gly Ala Val Leu Gly Gly Phe Leu Ala Val Val Gly Val Leu Val Arg 
185 190 195 

GAA ATC CTA GAT GAT CGT GTT CGC CGT CCA GAA GAT GTG GAA GAT GCC 3191 
Glu He Leu Asp Asp Arg Val Arg Arg Pro Glu Asp Val Glu Asp Ala 
200 205 210 215 

CTT GGA ATG ACA CTT CTT GGA ATT GTC CCT GAT ACA GAT AAA ATT TAA 3239 
35 Leu Gly Met Thr Leu Leu Gly He Val Pro Asp Thr Asp Lys He * 

220 225 230 

GGAGAAGAA ATG CCT TTA TTA AAG TTA GTT AAA TCA AAA GTA GAC TTT 3287 
Met Pro Leu Leu Lys Leu Val Lys Ser Lys Val Asp Phe 
1 5 10 

nrT aan aars 

40 



45 



50 



55 



GCT AAA 


AAG ACG GAA GAG TAT TAT AAC GCT 


ATT 


CGC 


ACA 


AAT 


ATT 


CAA 


3335 


Ala Lys 


Lys Thr Glu Glu Tyr Tyr Asn Ala 


lie 


Arg 


Thr 


Asn 


He 


Gin 




15 


20 




25 












TTT TCT 


GGT GCT CAG ATG AAA GTG ATT GCG 


ATT 


AGC 


TCT 


GTT 


GAA 


GCT 


3383 


Phe Ser 


Gly Ala Gin Met Lys Val He Ala 


He 


Ser 


Ser 


Val 


Glu 


Ala 




30 


35 


40 










45 




GGT GAA 


GGA AAA TCA ATG ATA TCT GTT AAC 


TTG 


GCG 


ATT 


TCA 


TTT 


GCT 


3431 


Gly Glu 


Gly Lys Ser Met He Ser Val Asn 


Leu 


Ala 


He 


Ser 


Phe 


Ala 




50 55 










60 






AGT GTT 


GGG CTC CGA ACA CTT CTG ATT GAT 


GCG 


GAA 


ACG 


CGT 


AAT 


TCT 


3479 


Ser Val 


Gly Leu Arg Thr Leu Leu He Asp 


Ala 


Glu 


Thr 


Arg 


Asn 


Ser 






65 70 








75 








GTT TTG 


TCA GGT ACA TTT AAA TCA AAT GAG 


CCT 


TAT 


AAA 


GGT 


CTT 


TCA 


3527 


Val Leu 


Ser Gly Thr Phe Lys Ser Asn Glu 


Pro 


Tyr 


Lys 


Gly 


Leu 


Ser 






80 85 




90 








AAT TTC 


CTT TCA GGA AAT GCC GAT CTA AAT 


GAA 


ACG 


ATT 


TGC 


CAA 


ACT 


3575 
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10 



Asn Phe Leu Ser Gly Aan Ala Asp Leu Asn Glu Thr He Cys Gin Thr 
95 100 105 

GAT ATT TCT GGT TTA GAT GTT ATT GCA TCT GGT CCT GTT CCA CCT AAT 3623 
Asp He Ser Gly Leu Asp Val He Ala Ser Gly Pro Val Pro Pro Asn 
110 115 120 125 

CCA ACA AGT CTT TTG CAA AAT GAT AAT TTT AGA CAT TTG ATG GAA GTT 3671 
Pro Thr Ser Leu Leu Gin Asn Asp Asn Phe Arg His Leu Met Glu Val 
130 135 140 

GCT CGT AGT TGT TAT GAT TAT GTC ATC ATC GAT ACA CCA CCA GTT GGT 3719 
Ala Arg Ser Cys Tyr Asp Tyr Val He He Asp Thr Pro Pro Val Gly 
145 150 155 

CTG GTT ATT GAT GCA GTT ATT ATT GCC CAT CAG GCT GAT GCC AGT CTT 3767 
Leu Val He Asp Ala Val He He Ala His Gin Ala Asp Ala Ser Leu 
160 165 170 

15 TTG GTT ACA GAA GCT GGG AAA ATT AAA CGT CGT TTC GTA ACT AAG GCC 3815 

Leu Val Thr Glu Ala Gly Lys He Lys Arg Arg Phe Val Thr Lys Ala 
175 180 185 

GTT GAA CAA TTG GTA GAA AGT GGT TCT CAG TTC TTA GGG GTC GTC CTT 3863 
Val Glu Gin Leu Val Glu Ser Gly Ser Gin Phe Leu Gly Val Val Leu 
190 195 200 205 



20 



25 



30 



AAT AAA GTT GAC ATG ACA GTT GAT AAA TAT GGA TTT TAT GGT TCT TAC 3911 
Asn Lys Val Asp Met Thr Val Asp Lys Tyr Gly Phe Tyr Gly Ser Tyr 
210 215 220 

GGA TCA TAT GGC GAG TAT GGA AAA AAA TCT GAC CAA AAA GAA GGT CAT 3959 
Gly Ser Tyr Gly Glu Tyr Gly Lys Lys Ser Asp Gin Lys Glu Gly His 
225 * 230 235 

TCA AGA GCA CAT CGT CGT AGA AAA GTC GGT TGG AAT TAACGCGTTA 4005 
Ser Arg Ala His Arg Arg Arg Lys Val Gly Trp Asn 
240 245 

GTGTGTTTTA AGATGTCGTT GGGAACGACA AGTGGAGGGA ATGAG ATG TCA CAA 4059 

Met Ser Gin 
1 





GCT 


AAA 


GAG GAA ATT TCA GAT GTT ATG ACT 


TAT 


TCA 


GAG 


CTA 


ACA 


AGT 


4107 




Ala 


Lys 


Glu Glu He Ser Asp Val Met Thr 


Tyr 


Ser 


Glu 


Leu 


Thr 


Ser 








5 


10 


15 














CAT 


AAG 


CCC AAA ATT ATT TAT AGC TTG ATT 


AAG 


CGG 


ATT 


GGT 


GAT 


ATT 


4155 




His 


Lys 


Pro Lys lie He Tyr Ser Leu He 


Lys 


Arg 


He 


Gly 


Asp 


He 




35 


20 




25 


30 




35 






TTG 


GTT 


AGT TCT ATT GGT TTA ATT ATT TTG 


ATA 


CCG 


CTA 


TTT 


TTG 


ATA 


4203 




Leu 


Val 


Ser Ser He Gly Leu He He Leu 


He 


Pro 


Leu 


Phe 


Leu 


He 










40 45 










50 








GTT 


GCT 


TTG ATC ATG AAA TGC TCT GAA CCA 


ACA 


GCA 


CCT 


ATA 


TTT 


TTC 


4251 


40 


Val 


Ala 


Leu He Met Lys Cys Ser Glu Pro 


Thr 


Ala 


Pro 


He 


Phe 


Phe 








55 60 








65 










TCA 


CAT 


ATT AGA AAT GGT AAA AAT GGC AAA 


AAG 


TTC 


AAA 


ATG 


TAT 


AAA 


4299 




Ser 


His 


He Arg Asn Gly Lys Asn Gly Lys 


Lys 


Phe 


Lys 


Met 


Tyr 


Lys 










70 75 






80 










TTT 


AGA 


ACC ATG TGT CAG GAC GCA GAA TCG 


ATT 


TTG 


ATG 


AAA 


GAT 


ACG 


4347 


45 


Phe 


Arg 


Thr Met Cys Gin Asp Ala Glu Ser 


He 


Leu 


Met 


Lys 


Asp 


Thr 






85 


90 




95 










GAA 


CTT 


TTT GCA AAA TTT AAG GCA AAT GGT 


TAT 


AAA 


CTT 


GAA 


ACG 


CAT 


4395 




Glu 


Leu 


Phe Ala Lys Phe Lys Ala Asn Gly 


Tyr 


Lys 


Leu 


Glu 


Thr 


His 






100 




105 


110 








115 






GAA 


GAT 


CCT AGA ATT ACA AAA ATC GGT GGC 


ATA 


TTA 


AGG 


AAA 


ACA 


AGT 


4443 


50 


Glu Asp 


Pro Arg He Thr Lys He Gly Gly 


He 


Leu 


Arg 


Lys 


Thr 


Ser 








120 125 








130 








ATT 


GAT 


GAA TTG CCA CAA CTG ATT AAT GTT 


TTT 


TTA 


GGA 


CAA 


ATG 


TCA 


4491 




He Asp 


Glu Leu Pro Gin Leu He Asn Val 


Phe 


Leu 


Gly 


Gin 


Met 


Ser 





55 
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135 140 145 

TTA GTG GGT CCA CGT CCA CTA CCA GAT AGA GAA ATC ATT GAA TAC GGT 4539 
Leu Val Gly Pro Arg Pro Leu Pro Asp Arg Glu lie lie Glu Tyr Gly 
5 150 155 160 

GAT AAC CAA GAA AAA TTT TTA AGC GTT AAA CCA GGC ATG ACA GGA TGG 4587 
Asp Asn Gin Glu Lys Phe Leu Ser Val Lys Pro Gly Met Thr Gly Trp 
165 170 175 

TGG CAA GTT TCA GGG AGA AGT ACT ATT GGG TAT CCT GAG CGG TGT CAT 4635 
Trp Gin Val Ser Gly Arg Ser Thr lie Gly Tyr Pro Glu Arg Cys His 
10 180 185 190 195 

CTT GAG CTT TAT TAT GTA GAA AAG TGT TGT TTT ACT TTC GAT GTT CTT 4683 
Leu Glu Leu Tyr Tyr Val Glu Lys Cys Cys Phe Thr Phe Asp Val Leu 
200 205 210 



15 



25 



30 



35 



40 



45 



50 



ATA TTA CTT AAG ACA ATT GGG ATT GTT TTG AAG AGA GTT GGA GCG CGT 4731 
He Leu Leu Lys Thr He Gly He Val Leu Lys Arg Val Gly Ala Arg 
215 220 225 

TAGTACTGAT GAAACAAAAA TTATTATTGA TAATAGAAGC GATGAGTGGT GGAGCCGGTC 4791 

GTCATGTACA AGACTTGATT AGTCATCTAC CTGAAGAAAA ATTTGATATT TATGTGATTT 4851 

ATTCAAATCA TAGAACAAAT CCTGTTTTTT GGAAAAAATA GTAACG ATG AAT GAG 4906 

Met Asn Glu 
1 



CAA GTA ACT 


TTT ATT TTA TGT 


GAT 


TTT CTC 


GTA 


AGA 


GAA 


ATT 


AAA 


CCG 


4954 


Gin Val Thr 


Phe He Leu Cys Asp Phe Leu 


Val 


Arg 


Glu 


He 


Lvs 


Pro 




5 


10 








15 










AAA TAT GAT 


TTG CTT GCT TAT 


CAA 


TTT ATT 


TCT 


AAA 


AAG 


ATT 


AAA 


GAA 


5002 


Lys Tyr Asp 


Leu Leu Ala Tyr Gin Phe He 


Ser 


Lys 


Lys 


He 


Lys 


Glu 




20 


25 






30 










35 




ATC AAA CCA 


GAT ATT GTA CAT 


TGT 


CAC AGT 


TCA 


AAA 


GCT 


GGT 


GTT 


ATT 


5050 


He Lys Pro 


Asp He Val His 


Cys His Ser 


Ser 


Lys 


Ala 


Gly 


Val 


He 




40 




45 








50 






GGT CGT TTA 


GCT GCC AAA AGA 


CGA 


GGT GTT 


AAA 


AAA 


ATA 


TTT 


TAT 


ACG 


5098 


Gly Arg Leu 


Ala Ala Lys Arg Arg Gly Val 


Lys 


Lys 


He 


Phe 


Tyr 


Thr 




55 




60 








65 








CCA CAT GCT 


TAT TCG TTT TTG 


GCA 


CCT GAA 


TTT 


AGT 


GGG 


AAG 


AAA 


AAG 


5146 


Pro His Ala 


Tyr Ser Phe Leu 


Ala 


Pro Glu 


Phe 


Ser 


Gly 


Lys 


Lys 


Lys 




70 


75 








80 






TTT CTA TTT 


GTT CAA ATT GAA 


AAG 


TTT TTA 


AGC 


CGA 


TTT 


GCG 


ACA 


ACT 


5194 


Phe Leu Phe 


Val Gin He Glu 


Lys 


Phe Leu 


Ser 


Arg 


Phe 


Ala 


Thr 


Thr 




85 


90 






95 












AAG ATA TTT 


TGT GTG TCA ATA 


GCG 


GAA ATG 


CAA 


GCT 


GCT 


CTT 


GAA 


GTA 


5242 


Lys He Phe 


Cys Val Ser He 


Ala 


Glu Met 


Gin 


Ala 


Ala 


Leu 


Glu 


Val 




100 


105 






110 










115 




AAT CTA GAT 


AAA ACC GAT AAG 


TTT 


CAG GTA 


ATT 


TAT 


AAT 


GGT 


TTG 


CCA 


5290 


Asn Leu Asp 


Lys Thr Asp Lys 


Phe 


Gin Val 


He 


Tyr 


Asn 


Gly 


Leu 


Pro 




120 




125 








130 






GAA ATT GAT 


TTA CCA AGC AAA 


GAA ACG ATT 


CGG 


GCG 


CAA 


TTA 


GGA 


CTG 


5338 


Glu He Asp 


Leu Pro Ser Lys Glu Thr He 


Arg 


Ala 


Gin 


Leu 


Gly 


Leu 




135 




140 






145 






GAA AAG GCA 


GCA GTT GTT ATA 


GGC 


AAT AAT 


GCA 


AAA 


ATG 


TCG 


GAA 


CAG 


5386 


Glu Lys Ala 


Ala Val Val He Gly Asn Asn 


Ala 


Lys 


Met 


Ser 


Glu 


Gin 




150 




155 






160 










AAA AAT CCT 


ATG TTT TTT ATG 


GAA 


ATT GCC 


CGA 


AAA 


ATG 


ATT 


AGA 


CAA 


5434 


Lys Asn Pro 


Met Phe Phe Met 


Glu 


He Ala 


Arg 


Lys 


Met 


He 


Arg 


Gin 




165 


170 






175 










AAC GCA AAT 


TGG CAT TTT GTG 


TGG 


GTA GGT 


GAT 


GGT 


CAG 


CTG 


ATG 


CCA 


5482 


Asn Ala Asn 


Trp His Phe Val Trp Val Gly 


Asp 


Gly 


Gin 


Leu 


Met 


Pro 




180 


185 






190 








195 





55 
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w 



15 



CTT TTT CAA TCA TTT ATT AAG CAA AAT GGA CTA GAG GGA AAT ATC CAT 5530 
Leu Phe Gin Ser Phe lie Lys Gin Asn Gly Leu Glu Gly Asn lie His 
200 205 210 

TTG CTT GGC GAG CGT CCT GAT AGT GAA ATA GTT GTG ACA GCC TAT GAC 5578 
Leu Leu Gly Glu Arg Pro Asp Ser Glu lie Val Val Thr Ala Tyr Asp 
215 220 225 

ATC TTC TTG ACG ACT TCC CAA TAT GAA GGT TTA CCT TAT GCA CCA ATT 5626 
lie Phe Leu Thr Thr Ser Gin Tyr Glu Gly Leu Pro Tyr Ala Pro lie 
230 235 240 

GAA GCG ATG CGA GCT GGT GTC CCG ATT CTT GCG ACA AAA GTT GTT GGC 5674 
Glu Ala Met Arg Ala Gly Val Pro He Leu Ala Thr Lys Val Val Gly 
245 250 255 

AAT AGT GAG CTT GTG ATA GAG GGC AAA AAT GGT TAT TTG ATT GAC TTA 5722 
Asn Ser Glu Leu Val He Glu Gly Lys Asn Gly Tyr Leu He Asp Leu 
260 265 270 275 

GAG TGG TCA AAA TCT GTC GAA GAA AAA TTA TAT AAG GCA GCG AAA ATA 5770 
Glu Trp Ser Lys Ser Val Glu Glu Lys Leu Tyr Lys Ala Ala Lys He 
280 285 290 

GAT GCA CAA ATG ATT AAA GCA GAT TTT AGG CAA AGG TTT GCG ATT 'GAT 5818 
Asp Ala Gin Met He Lys Ala Asp Phe Arg Gin Arg Phe Ala He Asp 
20 295 300 " 305 

CAG ATA TTA AAG CAA ATT GAA ACA ATT TAT TTA GCT TGAATGAAGA 5864 
Gin He Leu Lys Gin He Glu Thr He Tyr Leu Ala 
310 315 

ATGAGGAC 

25 



30 



ATGAGGAGGC 


ATAAATGCTG 


ATTTTGAAAT 


TAAAATTTCA 


TCTTAATTGG 


TACACAAACG 


5924 


AAAACCATTA 


TTACACGTGA 


GTATTCGAAG 


ACCTGGAAAC 


GAGGCGATGA 


GCCGTATTAT 


5964 


CCAGTGAACA 


ATGATCGTAA 


CAACAAACTC 


TATACTGCCT 


ATAAGCGTCT 


TGCCGAGCAA 


6044 


CAAGAGAATG 


TCATTTTCGG 


TGGACGTCTA 


GGTCACTACC 


GTTACTACGA 


TATGCACCAG 


6104 


GTAATTGGAG 


CTGCCTTGCA 


GTGTGTCAGA 


AATGAAGTGA 


AGTAAATCTT 


GATGAAGTTG 


6164 


AATAACTTTA 


AGTAATTTTA 


TACTTAATCC 


AATTGATGAA 


AATATTTTTG 


TATCGATTTA 


6224 


TCTTCTGTAA 


GAAGAGTCCT 


AATCGTTTAA 


AAAATGTACA 


ATTGAGTTTT 


TATATTTTTA 


6284 


AATAAAGTTA 


CTTTTAAGTC 


GTGTTATAGA 


ATATACATGA 


ATAGGTGTAT 


TAGAAAATTT 


6344 


ATTAATCTAA 


TCCTCGAAAA 


TAACTGACTG 


TAAGGAATCA 


AGTTGTGGAG 


TGTAAGTTGT 


6404 


CAAATGGAGA 


GGAAAATAAT 


ATG AAA AAA ATT TCA ATT TTA CAC TTT TCC 
Met Lys Lys He Ser He Leu His Phe Ser 


6454 



35 



10 

CAA GTA TCA GGC GGG GGA GTT GAA AAG TAC ATA AAA TTA TTT TTA AAG 6502 
40 Gin Val Ser Gly Gly Gly Val Glu Lys Tyr He Lys Leu Phe Leu Lys 

15 20 25 

TAT TCT GAT GTG ACA AAA TTT AAT AAT TAT TTA GTT GCA CCT AAT CTT 6550 
Tyr Ser Asp Val Thr Lys Phe Asn Asn Tyr Leu Val Ala Pro Asn Leu 
30 35 40 

45 GAA AAT TAT GAC GAA TTT AAT GGA TAT TTA AAG ATG TCT GTC AAT TTT 6598 

Glu Asn Tyr Asp Glu Phe Asn Gly Tyr Leu Lys Met Ser Val Asn Phe 
45 50 55 

AAT ATG GAA CAA ACT TTT TCT CCG CTA AAA ATA TTC AAA AAT GTC TTT 6646, 
Asn Met Glu Gin Thr Phe Ser Pro Leu Lys He Phe Lys Asn Val Phe 
60 65 70 



50 



TTT ATT CGT AGT GTA CTC AAA AAA ATA AAC CCA GAT ATA GTA TAC CTA 6694 
Phe He Arg Ser Val Leu Lys Lys He Asn Pro Asp He Val Tyr Leu 
75 80 85 90 



55 



20 



EP0 750 043A1 





CAT 
His 


AGT 
Ser 


ACA 
Thr 


TTT 
Phe 


GCA 
Ala 
95 


GGT 
Gly 


GTC 
Val 


GTA 
Val 


GGT 
Gly 


CGT 
Arg 
100 


ATT 
He 


GCT 
Ala 


TCA 
Ser 


ATA 
He 


GGT 
Gly 
105 


TTG 
Leu 


6742 


5 


CCA 
Pro 


ACA 
Thr 


AAA 
Lys 


GTA 
Val 
110 


GTA 
Val 


TAC 
Tyr 


AAT 
Asn 


CCT 
Pro 


CAC 
His 
115 


GGA 
Gly 


TGG 
Trp 


TCC 
Ser 


TTC 
Phe 


AAA 
Lys 
120 


ATG 
Met 


GAC 
Asp 


6790 




AAC 
Asn 


AGC 
Ser 


TAT 
Tyr 
125 


TTG 
Leu 


AAA 

Lys 


AAG 
Lys 


CTT 
Leu 


ATT 
He 
130 


TTT 
Phe 


AAA 
Lys 


TTA 
Leu 


ATC 
He 


GAA 
Glu 
135 


TTT 
Phe 


TCT 
Ser 


TTA 
Leu 


6838 


10 


TCT 
Ser 


TTT 
Phe 
140 


TTA 
Leu 


ACT 
Thr 


GAT 
Asp 


AAG 
Lys 


TTT 
Phe 
145 


ATT 
He 


TTA 
Leu 


ATT 
He 


TCG 
Ser 


GAA 
Glu 
150 


TCT 
Ser 


GAG 
Glu 


TAT 
Tyr 


ATT 
He 


6886 


15 


TTG 
Leu 
155 


GCT 
Ala 


AAC 
Asn 


CAT 
His 


ATT 
He 


TCA 
Ser 
160 


TTT 
Phe 


AAT 
Asn 


AAA 
Lys 


AGC 
Ser 


AAG 
Lys 
165 


TTT 
Phe 


TCA 
Ser 


CTA 
Leu 


ATT 
He 


AAT 
Asn 
170 


6934 


AAT 
Asn 


GGT 
Gly 


GTT 
Val 


GAA 
Glu 


GTG 
Val 
175 


ATT 
He 


ACA 
Thr 


GGG 
Gly 


GAT 
Asp 


TCA 
Ser 
180 


AGA 
Arg 


AAT 
Asn 


GAG 
Glu 


ATA 

He 


GAA 
Glu 
185 


GAG 
Glu 


6982 


20 


ATA 
lie 


TTT 
Phe 


CCA 
Pro 


AAT 

Asn 
190 


GAG 
Glu 


GAT 
Asp 


TTT 
Phe 


ATA 
He 


ATT 
He 
195 


GGC 
Gly 


ATG 
Met 


GTT 
Val 


GGC 
Gly 


AGA 
Arg 
200 


CTA 
Leu 


AGC 
Ser 


7030 


CCA 
Pro 


CCC 
Pro 


AAA 
Lys 
205 


GAG 
Glu 


TTT 
Phe 


TTC 
Phe 


TTT 
Phe 


TTT 
Phe 
210 


ATT 
He 


GAT 
Asp 


TTT 
Phe 


GCA 
Ala 


AAA 
Lys 
215 


AAA 
Lys 


ATA 
He 


TTA 
Leu 


7078 


25 


CAA 
Gin 


ATT 

He 

220 


CGA 
Arg 


AAC 
Asn 


GAT 
Asp 


ACC 
Thr 


AAT 
Asn 
225 


TTT 
Phe 


ATT 
He 


ATC 
He 


GTG 
Val 


GGT 
Gly 
230 


GAT 
Asp 


GGA 
Gly 


GAG 
Glu 


TTA 
Leu 


7126 




CGA 
Arg 

235 


AGT 
Ser 


GAA 
Glu 


ATA 
He 


GAA 
Glu 


AGA 
Arg 
240 


ATG 
Met 


ATA 

He 


CTA 
Leu 


GAT 
Asp 


AAT 
Asn 
245 


GGG 
Gly 


TTA 
Leu 


GGA 
Gly 


GAT 
Asp 


AAA 

Lys 
250 


7174 


30 


ATC 
He 


TAT 
Tyr 


ATT 
He 


ACT 
Thr 


GGG 
Gly 
255 


TGG 
Trp 


GTT 
Val 


GAT 
Asp 


AAT 
Asn 


CCG 
Pro 
260 


AGA 
Arg 


AAC 
Asn 


TAT 
Tyr 


ATA 

He 


GAG 
Glu 
265 


AAG 
Lys 


7222 




TTT 
Phe 


GAT 
Asp 


CAA 

Gin 


GCT 
Ala 
270 


ATT 
He 


CTG 
Leu 


TTT 
Phe 


TCT 
Ser 


AGA 
Arg 
275 


TGG 
Trp 


GAG 
Glu 


GGT 
Gly 


CTT 
Leu 


AGC 
Ser 
280 


CTA 
Leu 


ACG 
Thr 


7270 


35 


ATT 
He 


GCG 
Ala 


GAA 
Glu 
285 


TAT 
Tyr 


ATG 
Met 


TCT 
Ser 


CAG 
Gin 


AAG 
Lys 
290 


AAA 

Lys 


ACA 
Thr 


ATT 
He 


TTA 
Leu 


GCA 
Ala 
295 


ACA 
Thr 


AAT 
Asn 


ATT 
He 


7318 




GGT 
Gly 


GGC 
Gly 
300 


ATT 
He 


AAT 
Asn 


GAT 
Asp 


TTA 
Leu 


ATC 
He 
305 


ACT 
Thr 


GAT 
Asp 


GGT 
Gly 


GAA 
Glu 


ACA 
Thr 
310 


GGA 
Gly 


ATG 
Met 


CTG 
Leu 


ATT 
He 


7366 


40 


GAA 
Glu 
315 


GTT 
Val 


GGA 
Gly 


GAC 
Asp 


TTG 
Leu 


AAT 
Asn 
320 


TCA 
Ser 


GCA 
Ala 


GTA 
Val 


TCT 
Ser 


AAA 
Lys 

325 


TCT 
Ser 


TTC 
Phe 


GAG 
Glu 


CTA 
Leu 


AGA 
Arg 
330 


7414 




AAT 
Asn 


AAT 
Asn 


AAA 
Lys 


GAG 
Glu 


GTT 
Val 
335 


TCG 
Ser 


AAT 
Asn 


CAA 
Gin 


TTA 
Leu 


GCG 
Ala 
340 


AAT 
Asn 


AAC 
Asn 


GCT 
Ala 


TAT 
Tyr 


AAT 
Asn 
345 


AAA 
Lys 


7462 


45 


GTT 
Val 

TTA 

Leu 


GTT 
Val 

TTT 
Phe 


GAA 
Glu 

ATA 
He 
365 


CAG 
Gin 
350 
GAG 
Glu 


TTT 
Phe 

ATG 
Met 


TCG 
Ser 

TGT 
Cys 


ATT 
He 

AAC 
Asn 


GAA 
Glu 

AAT 
Asn 
370 


AAA 
Lys 
355 
GAG 
Glu 


CAG 
Gin 

AAA 
Lys 


ATG GCT GAG ATA GAA AGT 
Met Ala Glu He Glu Ser 
360 

TAGAGACTTA AAGAAAATAC 


7510 
7560 



AGGTTATTTG ATTGACTTAG AGTGGTCAAA ATCTGTCGAA GAAAAATTAT ATAAGGCAGC 7620 

50 

GAAAATGGAT GCACAAATGA TTAAAGCAGA TTTTAGGCAA AGGTTTGCGA TTGATCAGAT 7680 

GTTAAAGCAA ATTAAAACAA TTTATTTAGC TTGAATGAAG AAAGAGGAGG CATAA ATG 7738 



55 
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Met 
1 

CTG ATT TTG AAA TTA AAA TTT CAT CTT AAA TCG TTA TTC CTT AAA TGG 7786 
c Leu lie Leu Lys Leu Lys Phe His Leu Lys Ser Leu Phe Leu Lys Trp 

5 5 10 15 

ATT TAT CGA TTA CTT TAT CTA AAA AAG TTT CAG TTT GGT GCA CGC TTG 7834 
He Tyr Arg Leu Leu Tyr Leu Lys Lys Phe Gin Phe Gly Ala Arg Leu 
20 25 30 

ACG TTT CGA GAT GGG TTT CAT TTG TTA ATT GAA AAA TCT GGG AAA GTT 7882 
10 Thr Phe Arg Asp Gly Phe His Leu Leu He Glu Lys Ser Gly Lys Val 

35 40 45 

ATC ATC GGG AAT CAT GTT TTT TTT AAT AAC TTT TGT TCA ATT AAT GCC 7930 
He He Gly Asn His Val Phe Phe Asn Asn Phe Cys Ser He Asn Ala 
50 55 60 65 



15 



ATG TTA TCA GTA ACG ATT GGT GAT GAC TGT ATT TTT GGT GAA AAC GTT 7978 
Met Leu Ser Val Thr He Gly Asp Asp Cys He Phe Gly Glu Asn Val 
70 75 80 

AAA ATT TAT GAT CAC AAT CAT TGT TAT CAA AAT AAA AGT CAA CCT ATT 8026 
Lys He Tyr Asp His Asn His Cys Tyr Gin Asn Lys Ser Gin Pro lie 
85 90 ' 95 

20 TCA AAA CAA GGT TTT TCA ACT GCT GCT ATC CAG ATT GGT CGT AAC TGT 8074 

Ser Lys Gin Gly Phe Ser Thr Ala Ala He Gin He Gly Arg Asn Cys 
100 105 110 

TGG ATA GGT AGT CAA GTG ACG ATT TTA AAA GGT GTA ACC ATA GGT GAT 8122 
Trp He Gly Ser Gin Val Thr He Leu Lys Gly Val Thr He Gly Asp 
115 120 125 



25 



30 



35 



40 



45 



50 



AAT AGT ATC ATT GGT GCT GGT GTG GTA GTT TAT CAA GAT GTG CCA GAA 8170 
Asn Ser He He Gly Ala Gly Val Val Val Tyr Gin Asp Val Pro Glu 
130 135 140 145 

AAT TCG ATT GTT TTA TCT AAT GGA GAA ATT AGA AAG CGT GGC 8212 
Asn Ser He Val Leu Ser Asn Gly Glu He Arg Lys Arg Gly 
150 155 

TAATTAAA ATG TAT CTT AAA AGT CTA ATC TCT ATT GTT ATT CCA GTA TAT 8262 
Met Tyr Leu Lys Ser Leu He Ser He Val He Pro Val Tyr 
15 10 



AAT 


GTA 


GAG 


AAA 


TAT 


TTA 


GAA 


AAA 


TGT 


TTG 


CAA 


TCT 


GTT 


CAA 


AAT 


CAG 


8310 


Asn 


Val 


Glu 


Lys 


Tyr 


Leu 


Glu 


Lys 


Cys 


Leu 


Gin 


Ser 


Val 


Gin 


Asn 


Gin 




15 






20 






25 










30 




ACT 


TAC 


AAT 


AAT 


TTT 


GAA 


GTG 


ATT 


TTA 


GTG 


AAT 


GAT 


GGC 


TCA 


ACC 


GAT 


8358 


Thr 


Tyr 


Asn 


Asn 


Phe 


Glu 


Val 


He 


Leu 


Val 


Asn 


Asp 


Gly 


Ser 


Thr 


Asp 












35 










40 






45 




TCA 


TCA 


CTT 


TCA 


ATA 


TGC 


GAA 


AAA 


TTT 


GTT 


AAT 


CAG 


GAT 


AAA 


AGA 


TTT 


8406 


Ser 


Ser 


Leu 


Ser 


He 


Cys 


Glu 


Lys 


Phe 


Val 


Asn 


Gin 


Asp 


Lys 


Arg 


Phe 










50 










55 








60 






TCT 


GTT 


TTT 


TCT 


AAA 


GAA 


AAT 


GGT 


GGT 


ATG 


TCA 


TCT 


GCA 


CGA 


AAT 


TTT 


8454 


Ser 


Val 


Phe 


Ser 


Lys 


Glu 


Asn 


Gly 


Gly 


Met 


Ser 


Ser 


Ala 


Arg 


Asn 


Phe 








65 










70 










75 








GGA 


ATT 


AAA 


AAG 


GCT 


AAA 


GGA 


TCG 


TTT 


ATC 


ACA 


TTT 


GTA 


GAT 


AGT 


GAT 


8502 


Gly 


He 


Lys 


Lys 


Ala 


Lys 


Gly 


Ser 


Phe 


He 


Thr 


Phe 


Val 


Asp 


Ser 


Asp 






80 










85 










90 








GAC 


TAC 


ATA 


GTA 


AAA 


GAT 


TAT 


CTT 


TCT 


CAT 


TTG 


GTA 


GCT 


GGG 


ATA 


AAA 


8550 


Asp 


Tyr 


He 


val 


Lys 


Asp 


Tyr 


Leu 


Ser 


His 


Leu 


Val 


Ala 


Gly 


He 


Lys 




95 










100 










105 








110 




AGT 


GAG 


ACC 


TCT 


ATA 


GTT 


TGT 


TCA 


AAG 


TTT 


TTT 


CTT 


GTA 


GAT 


GAA 


AAA 


8S98 


Ser 


Glu 


Thr 


Ser 


He 


Val 


Cys 


Ser 


Lys 


Phe 


Phe 


Leu 


Val 


Asp 


Glu 


Lys 












115 






120 








125 




GGA 


AGT 


TTA 


TTG 


ACT 


AAA 


AAA 


GAG 


GCA 


CCT 


AAA 


AAG 


AAA 


TCA 


GAA 


GTC 


8646 


Gly 


Ser 


Leu 


Leu 


Thr 


Lys 


Lys 


Glu 


Ala 


Pro 


Lys 


Lys 


Lys 


Ser 


Glu 


Val 
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130 135 140 

GTT TCA ATT GAG GAA AGT ATT AAA ATT CTT CTG TTG CAA CAA AAT GGC 8694 

Val Ser He Glu Glu Ser He Lys He Leu Leu Leu Gin Gin Asn Gly 
145 150 155 

TAT GAT CTC GCT GTC TGG GGA AAA TTA TAC CCC GTT TCT TTC TTT GAA 8742 

Tyr Asp Leu Ala Val Trp Gly Lys Leu Tyr Pro Val Ser Phe Phe Glu 
160 165 170 

ACA ATT TCT TTC CCA GAA GGA AAA CTT TAC GAA GAT ATG GGA ACA ACT 8790 

Thr He Ser Phe Pro Glu Gly Lys Leu Tyr Glu Asp Met Gly Thr Thr 
10 175 180 185 190 

TAC AAA TTA CTA AAA TTG GCA AGT GAA GTG GTC TTC TTG GAT GCG TAT 8838 

Tyr Lys Leu Leu Lys Leu Ala Ser Glu Val Val Phe Leu Asp Ala Tyr 
195 200 205 



15 



GAT TAT GCC TAC GTA CAG CGA CCT AAT AGT ATC ATG AAT AGT TCT TTT 8886 
Asp Tyr Ala Tyr Val Gin Arg Pro Asn Ser He Met Asn Ser Ser Phe 
210 215 220 

AAT TTG AAA AAG TTG GAT ATA ATA GAA ATG GTT CAT GAA ATG GAA AAC 8934 
Asn Leu Lys Lys Leu Asp He He Glu Met val His Glu Met Glu Asn 
225 230 235 

GAT ATA TTA GCA CAG TTT CCA AAT TTA GCA TTA TAT GTT AAG AAT CGA 8982 
20 Asp He Leu Ala Gin Phe Pro Asn Leu Ala Leu Tyr Val Lys Asn Arg 

240 245 250 

GCA TTT GCC GCG GAA GTG AAA ATC TTT TTA GAG ATT CCA AAA GAA AAA 9030 
Ala Phe Ala Ala Glu Val Lys He Phe Leu Glu He Pro Lys Glu Lys 
255 260 265 270 



25 



GAA TTT GAG CAA GCG CAA AAG CAA CTT TGG CAT GAT ATC AAA AAG AAT 9078 
Glu Phe Glu Gin Ala Gin Lys Gin Leu Trp His Asp He Lys Lys Asn 
275 280 285 

AGA AAA GCA CCA TTT ATG ACA AAA GGT GCT AGA TTG AAG AAT AGG CTC 9126 
Arg Lys Ala Pro Phe Met Thr Lys Gly Ala Arg Leu Lys Asn Arg Leu 
290 295 300 

30 GGA GCT AGT CTG TCG TTT TTA GGT AAA TCT TTA TTT TTG ACT ATT GGG 9174 

Gly Ala Ser Leu Ser Phe Leu Gly Lys Ser Leu Phe Leu Thr He Gly 
305 310 315 

AAG CAG TTA GTA GAT AGA TAATGATATT GAAAGCGATA CGATACAATC 9222 
Lys Gin Leu Val Asp Arg 
320 

35 GTAAACTTCT TTTGGTGTTG ACTAGGAGTT AGCTTGAAAT TTGAATATAA AGGAAGCAAC 9282 

AC ATG GTA ATT TAT TTT TTA CTT TTC CCG ATG ATC GCA ATG ATT TAT 9329 
Met val He Tyr Phe Leu Leu Phe Pro Met He Ala Met He Tyr 
15 10 15 

TTA ATG ACA TTG CTC TTA CGG CAA AAA GCA CAA ATC CAA AAA ACG ATT 9377 
40 Leu Met Thr Leu Leu Leu Arg Gin Lys Ala Gin He Gin Lys Thr He 

20 25 30 

TTT TGT GTT CTT ACG TTT GGT ACA CTA GGC TTT ATT TCA GCA AGT CGT 9425 
Phe Cys Val Leu Thr Phe Gly Thr Leu Gly Phe He Ser Ala Ser Arg 
35 40 45 



45 



50 



55 



GCA TCA AGT GTT GGG ACG GAC GTT ACT TTA TAC GAA AAT ATT TTT AAA 9473 

Ala Ser Ser Val Gly Thr Asp Val Thr Leu Tyr Glu Asn He Phe Lys 
50 55 60 

TCT ATA AAT TAC GGG ATA AGT GCT GAG AAT AAT TGG GGA TAC GTC ATC 9521 

Ser He Asn Tyr Gly lie Ser Ala Glu Asn Asn Trp Gly Tyr Val He 
65 70 75 

TAT AAC AAG CTG ATT GGT AGT GTA TTT GGC TAT ACA GGA CAT GAA ATC 9569 

Tyr Asn Lys Leu lie Gly Ser Val Phe Gly Tyr Thr Gly His Glu He 
80 85 90 95 
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5 



10 



15 



20 



35 



50 



ACQ 
Thr 


GCC 
Ala 


GCT 
Ala 


AAT 
Asn 


TCA 
Ser 
100 


GTT 
Val 


TTG 
Leu 


ATT 

He 


ACA 
Thr 


ATA 
He 
105 


CTT 
Leu 


ATT 
He 


GGT 
Gly 


ATT 
He 


TTT 
Phe 
110 


ATT 
He 


9617 


TGG 
Trp 


AAA 
Lys 


GTA 
Val 


GCG 
Ala 
115 


GAA 
Glu 


CAT 
His 


TAT 
Tyr 


TTT 
Phe 


GTT 
val 
120 


GCG 
Ala 


ACQ 
Thr 


TTT 
Phe 


TTA 
Leu 


TAC 
Tyr 
125 


ATT 
He 


AGC 
Ser 


9665 


TTG 
Leu 


TTT 
Phe 


TAT 
Tyr 
130 


TAT 
Tyr 


GCT 
Ala 


ACA 
Thr 


AGT 
Ser 


TTT 
Phe 
135 


AAT 
Asn 


ATT 
He 


TCA 
Ser 


AGA 
Arg 


CAA 
Gin 
140 


TTT 
Phe 


ATT 
He 


GCC 
Ala 


9713 


ATG 
Met 


GGG 
Gly 
145 


CTT 
Leu 


GTA 
Val 


TTG 
Leu 


GTA 
Val 


GCA 
Ala 
150 


ATT 
He 


TCT 
Ser 


TTT 
Phe 


GCT 
Ala 


TTA 
Leu 
155 


GAT 
Asp 


AAA 
Lys 


AAG 
Lys 


GTT 
Val 


9761 


ATG 
Met 
160 


CCT 
Pro 


TGG 
Trp 


TTT 
Phe 


ATC 
He 


TTG 
Leu 
165 


ACA 

Thr 


GTT 
Val 


TTG 
Leu 


GCT 
Ala 


ACC 
Thr 
170 


TTA 
Leu 


TTT 
Phe 


CAT 
His 


GCG 
Ala 


ACA 
Thr 
175 


9809 


GCA 
Ala 


ATC 
He 


GTT 
Val 


GCT 
Ala 


TTT 

Phe 
180 


CCT 
Pro 


GTC 
Val 


TAT 
Tyr 


TGG 
Trp 


CTT 
Leu 
185 


ACA 
Thr 


AAA 
Lys 


GTA 
Val 


CAT 
His 


TGG 
Trp 
190 


GAT 
Asp 


9857 


GTG 
Val 


AAA 
Lys 


AAG 
Lys 


ACA 
Thr 
195 


TTA 
Leu 


AGT 
Ser 


ATT 
He 


TTT 
Phe 


CCA 
Pro 
200 


ATC 
He 


ACQ 
Thr 


ATT 
He 


TTT 
Phe 


GCA 
Ala 
205 


AGT 
Ser 


TTT 
Phe 


. 9905 


ATT 
lie 


TTT 
Phe 


GAT 
Asp 
210 


GCT 
Ala 


ATT 

He 


TTA 
Leu 


AAC 
Asn 


ATT 

He 
215 


TTT 
Phe 


GTA 
Val 


CGT 
Arg 


TTT 
Phe 


TTC 
Phe 
220 


CCA 
Pro 


CAT 
His 


TAT 

Tyr 


9953 


GAG 
Glu 


ATG 
Met 
225 


TAT 
Tyr 


ATC 
He 


ACT 
Thr 


GGA 
Gly 


ACA 
Thr 
230 


CAA 
Gin 


TTT 
Phe 


AAT 
Asn 


ATT 
He 


TCA 
Ser 
235 


GAT 
Asp 


CAG 
Gin 


GGG 
Gly 


CAG 
Gin 


10001 


GGA 
Gly 
240 


CGT 
Arg 


GTG 
Val 


GTT 
Val 


TTG 
Leu 


GTC 
Val 
245 


AAA 
Lys 


ATA 
He 


TTT 
Phe 


ATC 
He 


TTG 
Leu 
250 


CTC 
Leu 


ATT 
He 


TTG 
Leu 


TTT 
Phe 


ACT 
Thr 
255 


10049 


TTA 
Leu 


TTC 
Phe 


TTG 
Leu 


TTT 

Phe 


TAT 
Tyr 
260 


AAA 
Lys 


AAA 
Lys 


AGC 
Ser 


TAT 
Tyr 


GCT 
Ala 
265 


TTG 
Leu 


ATT 
He 


TCT 
Ser 


GAA 
GlU 


TGT 
Cys 
270 


CAT 
His 


10097 


CAA 
Gin 


AGT 
Ser 


TTG 
Leu 


ATA 
He 
275 


GCT 
Ala 


TTG 
Leu 


ACA 
Thr 


ACC 
Thr 


GTT 
Val 
280 


GGA 
Gly 


TTA 
Leu 


AGT 
Ser 


ATC 
He 


GGT 

Gly 
285 


ATT 
He 


GTA 
Val 


10145 


TTT 
Phe 


TAT 

Tyr 


AAT 
Asn 
290 


AAT 
Asn 


ATT 
He 


TTA 
Leu 


CTC 
Leu 


AAT 
Asn 
295 


AGA 
Arg 


ATA 
He 


GAA 
Glu 


ATG 
Met 


TTT 
Phe 
300 


TAT 
Tyr 


TCA 
Ser 


ATT 
He 


10193 


TTA 
Leu 


AGC 
Ser 
305 


ATC 
He 


GTA 
Val 


TTT 
Phe 


ATT 

He 


CCA 
Pro 
310 


ATT 
He 


GCT 
Ala 


ATA 
He 


GAT 
Asp 


TAC 
Tyr 
315 


ATT 
He 


AGT 
Ser 


TTG 
Leu 


AAA 

Lys 


10241 


TTT 
Phe 

320 


AAA 
Lys 


CAA 
Gin 


AAA 

Lys 


GAT 
Asp 


GCT 
Ala 
325 


GTG 
Val 


CGA 
Arg 


CTA 
Leu 


ATG 
Met 


CTG 
Leu 
330 


ACG 
Thr 


ATA 
He 


GGT 
Gly 


ATT 
He 


TTG 
Leu 
335 


10289 


TTA 
Leu 

GGA 
Gly 


ATT 

He 

ATA 
He 


ACA 
Thr 

TTG 
Leu 


CTT 
Leu 

CCT 
Pro 
355 


GTG 
Val 
340 
TAT 
Tyr 


CCT 
Pro 

GTT 
Val 


TAC 
Tyr 

ATT 
He 


TAT 
Tyr 

CAA 
Gin 


ATA 

lie 

CAA 
Gin 
360 


CAG GTT AGC GGT AAT TAT 
Gin Val Ser Gly Asn Tyr 
345 350 
TAAAAAATAA AG TTT AG AGA 


TCA 
Ser 


10337 
10384 


GGAAATA 


ATG 
Met 
1 


GAG 
Glu 


GAT 
Asp 


AGA 
Arg 


AAG 
Lys 
5 


AAA 
Lys 


CAA 
Gin 


GTA 
Val 


ATT 
He 


TTG 
Leu 
10 


ATA 
He 


CTA TCC 
Leu Ser 


CAC 
His 


10433 


AGA AAT 
Arg Asn 
15 


ACT 
Thr 


CTC 
Leu 


GCT 
Ala 


CTA 
Leu 
20 


AAA 

Lys 


TCA 
Ser 


ACA 
Thr 


ATA GAG CTT TTG GAT TCT 
He Glu Leu Leu Asp Ser 
25 


CAA 
Gin 
30 


10481 



24 
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5 



15 



25 



35 



TAC 
Tyr 


TTT 
Phe 


GAT 
Asp 


TTC 
Phe 


TTT 
Phe 
35 


CTT 
Leu 


CAT 
His 


ATA 
He 


GAT 
Asp 


AAA 
Lys 
40 


AAA 
Lys 


AGT 
Ser 


AGA 
Arg 


ATT 
He 


CAA 
Gin 
45 


GAT 
Asp 


10529 


TTT 
Phe 


TTT 
Phe 


TAT 
Tyr 


TTA 
Leu 
50 


AAA 

Lys 


AAA 

Lys 


ATT 

He 


ACA 
Thr 


AAA 
Lye 
55 


TTC 
Phe 


TCC 
Ser 


ACT 
Thr 


ATT 

He 


CAT 
His 
60 


TTT 
Phe 


TCA 
Ser 


10577 


GAA 
Glu 


AGA 
Arg 


AAA 
Lys 
65 


AAT 
Asn 


GTA 
Val 


CAT 
His 


TGG 
Trp 


GGA 
Gly 
70 


GGT 
Gly 


TTT 
Phe 


TCT 
Ser 


ATG 
Met 


GTA 
Val 
75 


GAA 
Glu 


GCA 
Ala 


ATG 
Met 


10625 


TTT 
Phe 


GCG 
Ala 
80 


CTA 
Leu 


TTA 
Leu 


GAA 
Glu 


TGT 
Cys 


GCA 
Ala 
85 


CGT 
Arg 


GAT 
Asp 


ACA 
Thr 


GGA 
Gly 


GAA 
Glu 
90 


TAT 
Tyr 


TCT 
Ser 


TAT 
Tyr 


TTT 
Phe 


10673 


CAT 
His 
95 


TTT 
Phe 


TTA 
Leu 


TCT 
Ser 


GGA 
Gly 


GAT 
Asp 
100 


GAT 
Asp 


ATG 
Met 


CCA 
Pro 


ATC 
He 


AAA 

Lys 
105 


GAT 
Asp 


AAT 
Asn 


GAA 
Glu 


ATA 
He 


GTA 
Val 
110 


10721 


TTT 
Phe 


AAT 
Asn 


TTT 
Phe 


TTT 
Phe 


GAA 
Glu 
115 


AAT 

Asn 


AGT 
Ser 


TAT 
Tyr 


CCT 
Pro 


AAA 
Lys 
120 


AAT 
Asn 


TTT 
Phe 


ATT 
He 


GAT 
Asp 


ATT 
He 
125 


CTA 
Leu 


10769 


GAT 
Asp 


TTT 
Phe 


GAA 
Glu 


AAT 
Asn 
130 


GTC 
Val 


AAT 
Asn 


AAA 

Lys 


AAT 
Asn 


TCA 
Ser 
135 


TAT 
Tyr 


TTC 
Phe 


TAC 
Tyr 


GAA 
Glu 


ccc 

Pro 
140 


CCT 
Pro* 


GAG 
Glu 


10817 


ATG 
Met 


ATA 
He 


GAG 
Glu 
145 


GAG 
Glu 


AGA 
Arg 


GTG 
Val 


AAG 
Lys 


TAC 
Tyr 
150 


TAC 
Tyr 


TAT 
Tyr 


CCT 
Pro 


CAT 
His 


ATG 
Met 
155 


GAT 
Asp 


ATT 

He 


CTA 
Leu 


10865 


AAC 
Asn 


AGA 
Arg 
160 


AAA 
Lys 


GGA 
Gly 


ACA 
Thr 


AAT 
Asn 


TTC 
Phe 
165 


ATA 
He 


GGG 
Gly 


AAA 

Lys 


AAA 

Lys 


CTA 
Leu 
170 


ATT 
He 


TAT 
Tyr 


CTA 
Leu 


CAA 
Gin 


10913 


AAA 
Lys 
175 


TTG 
Leu 


TTG 
Leu 


AAA 
Lys 


GTT 
Val 


AAT 
Asn 
180 


CGC 
Arg 


TTG 
Leu 


AAA 

Lys 


AAT 
Asn 


AGA 
Arg 
165 


GAG 
Glu 


ATA 
He 


GAA 
Glu 


ATT 
He 


TTC 
Phe 
190 


10961 


AAG 
Lys 


GGT 
Gly 


CAT 
His 


CAA 
Gin 


TGG 
Trp 
195 


TGT 
Cys 


AGT 
Ser 


TTG 
Leu 


ACA 
Thr 


AAT 
Asn 
200 


CAA 

Gin 


TTT 
Phe 


GTA 

Val 


GAT 
Asp 


ATT 
He 
205 


TTA 
Leu 


11009 


TTG 
Leu 


GAT 
Asp 


AAA 

Lys 


GAG 
Glu 
210 


GAA 
Glu 


AGA 
Arg 


AGA 
Arg 


GTA 
Val 


GGT 
Gly 
215 


AAG 
Lys 


TCT 
Ser 


TAT 
Tyr 


TTT 
Phe 


TCA 
Ser 
220 


TCT 
Ser 


AGT 
Ser 


11057 


TTA 
Leu 


ATA 
He 


CCA 
Pro 
225 


GAT 
Asp 


GAA 
Glu 


TGT 
Cys 


TAT 
Tyr 


TTT 
Phe 

230 


CAA 
Gin 


ACG 
Thr 


TTT 
Phe 


GCT 
Ala 


ATG 
Met 
235 


ATA 
He 


AAA 

Lys 


AAA 

Lys 


. 11105 


GTT 
Val 


GAA 
Glu 
240 


ATT 
He 


TAT 
Tyr 


CAA 
Gin 


CAG 
Gin 


AAA 
Lys 
245 


AAT 
Asn 


ATG 
Met 


TCA 
Ser 


GCA 
Ala 


CGC 
Arg 
250 


TTA 
Leu 


ATT 
He 


GAT 
Asp 


TGG 
Trp 


11153 


ACA 
Thr 
255 


AGA 
Arg 


GGG 
Gly 


AAA 

Lys 


CCA 
Pro 


TAT 
Tyr 
260 


ATT 
He 


TGG 
Trp 


CGA 
Arg 


CAG 
Gin 


GAT 
Asp 
265 


GAT 
Asp 


Phe 


Phe 


GAA 
Glu 


lie 
270 


11201 


ATG 
Met 

GAT 
Asp 


AAT 
Asn 

CGT 
Arg 


GAT 
Asp 

AAA 

Lys 


AAA 
Lys 

ATA 
He 
290 


GAT 
Asp 
27S 
ATT 
He 


TCA 
Ser 

GAA 
Glu 


ATG 
Met 

GAA 
Glu 


TTT 
Phe 

ATT 
He 


TCT 
Ser 

TAT 
Tyr 
295 


AGG 
Arg 
280 
ATA 
He 


AAG 
Lys 

AAA 

Lys 


TTT 
Phe 

ATA 

He 


GAT 
Asp 

AGA 
Arg 


GAA 
Glu 

GGA 
Gly 
300 


AAT 
Asn 
285 
AGA 
Arg 


GTA 
Val 

AGT 
Ser 


11249 
11297 


ACT 
Thr 


GAT 
Asp 


GAA 
Glu 
305 


GCA 
Ala 


AAT 
Asn 


AAA 
Lys 


ATC 
He 


AAA 
Lys 
310 


GAT 
Asp 


AAG 
Lys 


AGA 
Arg 


TTT 
Phe 


ACA 
Thr 
315 


AAA 
Lys 






11339 



TAATTTTACC TATGTTTTTG GAAAGAAAAC TTTTCTTGGA AGGGGAGAAG CGATTATCAT 11399 
AGATGAACCT GAGCATGGAA ATTTGGGAGA TCAAGCAATT GCTTTTGCAG AAAATCAATT 11459 
TTTAGTAAAT CATGTATCAG TACGAGATGT AGAACATCTT ATAGAAAGCA AAACTATTTC 11519 
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w 



15 



AGAAATAAAA 


TCTATAAAAA 


AAAATATTGG 


AAAAAAAGAA 


TTAGTTTTTT 


TTCATGGGGG 


11579 


AGGAAATTTC 


GGGACACTTT 


ATCTAAAGTA 


TGAGCGCATT 


AGAAGATTGG 


CAGTATCAAA 


11639 


GCTTCCCTTT 


AATAAAATGA 


TTCTATTTCC 


TCAGTCAATT 


TCATTTGAAG 


ATAGTAGGTT 


11699 


TGGTCAGAAG 


CAGCTGAATA 


AAAGTAAAAA 


AATATACAGT 


CAAAATACAA 


ATTTTATTTT 


11759 


GACTGCAAQA 


GAACCAAAAT 


CTTATGGTTT 


AATGAAGAAA 


TGTTTTCCAT 


ATAACAAAGT 


11819 


AATCTTGACA 


CCGGATATCG 


TGCTCTCATT 


TAAATTTGAA 


GTCACCATTT 


CTGATACGCA 


11879 


TATTGGGAAA 


GAAAAGGATA 


GTGTTATAAC 


TTATGAAAAT 


CGTCAACACT 


ATCTTGAGAT 


11939 


AAAGTGGGAT 


GAAATTGCGC 


AGCATGAGGT 


CGCCTTAACT 


GATAGATTAC 


ATGGTATGAT 


11999 


TTTTTCATAT 


ATCACAGGCA 


CACCATGTGT 


TGTTTTGGCT 


AATAATAATC 


ATAAAATTGA 


12059 


AGGAACATAC 


AAACATTGGT 


TGAATGAAGT 


CAACTATATT 


CGTTTTATTG 


AAAATCCGAC 


12119 


TGTTGAAAAT 


ATTTTAGATG 


CAATCAATGA 


CTTAAAGCAA 


ATCGAACCTC 


ACTATATTGA 


12179 


TTTATCTGAT 


AAATTTCAAC 


CACTAATTGA 


TGCGATAAAA 


GGGTAAAGGT 


TTA ATG 


12235 



Met 
1 





AAT 


AAA 


TAT 


AAA AAA CTA CTA TCC AAC TCT 


CTT 


GTT 


TTC 


ACG 


ATA 


GGA 


12283 


20 


Asn 


Lys 


Tyr 


Lys Lys Leu Leu Ser Asn Ser 


Leu 


VaJ. 


XT UC 




lie 


m v 

uiy 








5 10 








15 










AAC 


TTA 


GGC 


AGC AAA CTG TTA GTC TTT TTA 


CTC 


GTA 


CCG 


CTC 


TAC 


ACC 


12331 




Asn 


Leu Gly Ser Lys Leu Leu Val Phe Leu 


Leu 


Val 


xr to 


Leu 


Tyr 


Thr 










20 


25 






O v 








25 


TAT 


GCG 


ATG 


ACA CCG CAA GAG TAT GGT ATG 


GCA 


GAC 


TTA 


TAT 


CAA 


ACA 


12379 




Tyr 


Ala Met Thr Pro Gin Glu Tyr Gly Met 




Asp 


Leu 


Tvrr 

iyx 




Thr 






35 




40 




45 














ACA 


GCA 


AAT 


CTA CTT TTG CCA TTA ATT ACA 


ATG 


AAT 


GTA 


TTT 


GAT 


GCA 


12427 




Thr 


Ala 


Asn 


Leu Leu Leu Pro Leu lie Thr 


Met 


Asn 


Val 


Phe 


Asp 


Ala 




30 


50 






55 


60 








65 




ACT 


TTA 


CGT 


TTT GCT ATG GAA AAG TCA ATG 


ACA 


AAA 


GAG 


AGT 


GTG 


TTA 


12475 




Thr 


Leu Arg Phe Ala Met Glu Lys Ser Met 


Thr 


Lys 


Glu 


Ser 


Val 


Leu 












70 75 








80 








ACA 


AAT 


TCT 


CTT GTG GTT TGG TGT TTT AGC 


GCG 


GTG 


TTC 


ACT 


TGT 


TTG 


12523 




Thr 


Asn 


Ser 


Leu Val Val Trp Cys Phe Ser 


Ala 


Val 


Phe 


Thr 


Cys 


Leu 




35 








85 90 








95 








GGC 


GCT 


TGT 


ATT ATC TAT GCG TTG AAC TTG 


AGT 


AAT 


AAA 


TGG 


TAT 


TTA 


12571 




Gly 


Ala 


Cys 


He He Tyr Ala Leu Asn Leu 


Ser 


Asn 


Lys 


Trp 


Tyr 


Leu 








100 


105 






110 












GCT 


TTA 


CTT 


TTA ACC TTC AAC TTA TTT CAA 


GGT 


GGA 


CAA 


AGT 


ATA 


TTA 


12619 




Ala 


Leu 


Leu 


Leu Thr Phe Asn Leu Phe Gin 


Gly 


Gly 


Gin 


Ser 


He 


Leu 




40 




115 




120 


125 














AGC 


CAG 


TAT 


GCT AGA GGT ATA GGA AAG TCG 


AAA 


ATA 


TTT 


GCA 


GCT 


GGC 


12667 




Ser 


Gin Tyr Ala Arg Gly lie Gly Lys Ser 


Lys 


He 


Phe 


Ala 


Ala 


Gly 






130 






135 


140 










145 






GGA 


GTT 


ATT 


TTA ACC TTT TTG ACA GGC GCT 


TTA 


AAT 


ATT 


CTT 


TTT 


TTG 


12715 




Gly 


Val 


lie 


Leu Thr Phe Leu Thr Gly Ala 


Leu 


Asn 


He 


Leu 


Phe 


Leu 




45 






150 155 










160 








GTA 


TAT 


TTA 


CCG CTT GGG ATT ACG GGC TAT 


TTA 


ATG 


TCC 


CTG 


GTT 


TTA 


12763 




Val 


Tyr 


Leu 


Pro Leu Gly He Thr Gly Tyr 


Leu 


Met 


Ser 


Leu 


Val 


Leu 










165 170 








175 










GCG 


AAT 


GTA 


GGT ACG ATT CTA TTT TTT GCT 


GGC 


ACA 


CTT 


TCC 


ATT 


TGG 


12811 


50 


Ala 


Asn 


Val 


Gly Thr He Leu Phe Phe Ala 


Gly 


Thr 


Leu 


Ser 


He 


Trp 








180 


185 




190 










AAG 


GAA 


ATT 


AGT TTT AAA ATA ATT GAT AAA 


AAA 


CTG 


ATT 


TGG 


CAA 


ATG 


12859 




Lys 


Glu 


lie 


Ser Phe Lys He He Asp Lys 


Lys 


Leu 


He 


Trp 


Gin 


Met 





55 



26 
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195 



200 



205 



5 


CTC 

Leu 
210 


TAT 
Tyr 


TAT 
Tyr 


GCC 
Ala 


TTA 
Leu 


CCT 
Pro 
215 


TTG 
Leu 


ATT 

He 


CCT 
Pro 


AGT 
Ser 


TCC 
Ser 
220 


ATC 
He 


CTG 
Leu 


TGG 
Trp 


TGG 
Trp 


TTA 
Leu 
225 


12907 




CTG 
Leu 


AAT 
Asn 


GCT 
Ala 


TCT 
Ser 


AGT 
Ser 
230 


CGC 
Arg 


TAT 

Tyr 


TTC 
Phe 


GTT 
Val 


TTA 

Leu 
235 


TTC 
Phe 


TTT 
Phe 


TTA 
Leu 


GGA 
Gly 


GCA 
Ala 
240 


GGT 
Gly 


12955 


10 


GCT 
Ala 


AAT 
Asn 


GGT 
Gly 


CTT 

Leu 
245 


TTG 
Leu 


GCG 
Ala 


GTC 
Val 


GCT 
Ala 


ACC 
Thr 
250 


AAA 
Lys 


ATT 
He 


CCA 
Pro 


AGT 
Ser 


ATT 
He 
255 


ATT 
He 


TCC 
Ser 


13003 




ATT 

lie 


TTT 
Phe 


AAT 
Asn 
260 


ACG 
Thr 


ATT 
He 


TTT 
Phe 


ACA 
Thr 


CAG 
Gin 
265 


GCG 
Ala 


TGG 
Trp 


CAA 
Gin 


ATT 
He 


TCA 
Ser 
270 


GCC 
Ala 


ATA 
He 


GAA 
Glu 


13051 


15 


GAA 
GlU 


TAT 
Tyr 
275 


GAT 
Asp 


TCT 
Ser 


CAT 
His 


CAA 
Gin 


AAA 

Lys 
280 


TCA 
Ser 


AAA 

Lys 


TAT 

Tyr 


TAT 
Tyr 


TCG 
Ser 
285 


GAT 
Asp 


GTT 
Val 


TTT 
Phe 


CAC 
His 


13099 




TAC 
Tyr 
290 


TTA 
Leu 


GCA 
Ala 


ACT 
Thr 


Phe 


CTA 
Leu 
295 


TTG 
Leu 


TTA 
Leu 


GGG 
Gly 


ACA 
Thr 


TCA 

Ser 

300 


GCT 
Ala 


Phe 


Met 


ATT 
lie 


GTG 
Val 
305 


J. J ±*m 1 


20 


CTT 
Leu 


AAA 

Lys 


CCA 
Pro 


ATT 
He 


GTC 
Val 
310 


GAA 
Glu 


AAA 
Lys 


GTC 
Val 


GTT 
Val 


TCA 
Ser 
315 


AGT 
Ser 


GAC 
Asp 


TAT 
Tyr 


GCA 
Ala 


AGT 
Ser 
320 


TCA 
Ser 


13195 




TGG 
Trp 


CAA 
Gin 


TAT 
Tyr 


GTT 

Val 
325 


CCT 
Pro 


TTC 
Phe 


TTT 
Phe 


ATG 
Met 


TTG 
Leu 
330 


TCG 
Ser 


ATG 
Met 


CTA 
Leu 


TTT 
Phe 


TCC 
Ser 
335 


TCG 
Ser 


TTT 
Phe 


13243 


25 


TCT 
Ser 


GAT 
Asp 


TTT 
Phe 
340 


TTT 
Phe 


GGG 
Gly 


ACT 
Thr 


AAT 
Asn 


TAT 
Tyr 
345 


ATT 
He 


GCG 
Ala 


GCT 
Ala 


AAA 

Lys 


CAA 
Gin 
350 


ACA 
Thr 


AAA 
Lys 


GGC 
Gly 


13291 




GTA 
val 


TTT 

Phe 
355 


ATG 
Met 


ACA 
Thr 


TCT 
Ser 


ATC 
He 


TAT 
Tyr 
360 


GGT 
Gly 


ACC 
Thr 


ATT 
He 


GTT 
Val 


TGT 
Cys 
365 


GTC 
Val 


TTA 
Leu 


CTC 
Leu 


CAA 
Gin 


13339 


30 


GTG 
Val 
370 


GTG 
Val 


CTG 
Leu 


CTA 
Leu 


CCC 
Pro 


ATC 
He 
375 


ATC 
He 


GGC 
Gly 


TTG 
Leu 


GAT 
Asp 


GGC 
Gly 
380 


GCA 
Ala 


GGT 
Gly 


TTA 
Leu 


TCA 
Ser 


GCC 
Ala 
385 


13387 


35 


ATG 
Met 


CTT 
Leu 


GGA 
Gly 


TTT 
Phe 


TTA 
Leu 
390 


ACA 
Thr 


ACG 
Thr 


TTT 
Phe 


TTA 
Leu 


TTG 
Leu 
395 


CGT 
Arg 


GTC 
Val 


AAA 
Lys 


GAT 
Asp 


ACG 
Thr 
400 


CAA 
Gin 


13435 


AAA 
Lys 


TTT 
Phe 


GTG 
Val 


GTG 
Val 
405 


ATT 
He 


CAG 
Gin 


ATT 
He 


AAG 
Lys 


TGG 
Trp 
410 


CGG 
Arg 


ATT 
He 


TTT 
Phe 


ATC 
He 


AGT 
Ser 
415 


AAT 

Asn 


TTA 
Leu 


13483 


40 


TTG 
Leu 


ATC 
He 


GTT 
Val 
420 


TTG 
Leu 


GCA 
Ala 


CAA 
Gin 


ATT 
He 


TTA 

Leu 
425 


TGT 
Cys 


TTG 
Leu 


TTT 
Phe 


TAT 
Tyr 


CTA 
Leu 
430 


CCG 
Pro 


AGT 
Ser 


GAA 
Glu 


13531 


TTT 
Phe 

AAT 
Asn 
450 


TTG 
Leu 
435 
CAG 
Gin 


TAT 
Tyr 

CGT 
Arg 


TTT 
Phe 

ACA 
Thr 


GGT 
Gly 

ATT 
He 


CTT 
Leu 

TTA 
Leu 
455 


GCC 
Ala 
440 
TAC 
Tyr 


CTA 
Leu 

ATT 
He 


TTA 
Leu 

ATC 
He 


TTT 
Phe 

ATG 
Met 


TGT 
Cys 

GCG 
Ala 
460 


GGC 
Gly 
445 
CTA 
Leu 


ATG 
Met 

AAA 

Lys 


TTA 
Leu 

ATA 
He 


GTG 
val 

AAA 

Lys 


GTT 
Val 

AAT 
Asn 
465 


13579 
13627 


45 


AAG 
Lys 


ACA 
Thr 


TTT 
Phe 


GGA 
Gly 


ATG 
Met 
470 


AAA 
Lys 


TCC 
Ser 


TCA 
Ser 


TAAAAATAGA CAGGAGGTGT ATCTCGAATG 


13681 



50 



GTATCGAGAT ATATCTCCTG TCTATTTTTA TGATACTTTT GTGTTAGCTC AACTCAACCG 13741 

CCTTTTAATC TCCCAACAAC AATAATACCC AATCAAACAA CCCAAAAAAT TCAAGATAAT 13801 

ATCACTAATG GCAAATGTGC CCAAATAAAA GATAAATTGA ATGGTTTCAA TTACTAAAAG 13861 

AGTGACCAAA CTGACAATGA CAAACTGTTT GAAATCAGTA TTGATACAGT AAAGGCCACC 13921 



55 



27 
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10 



15 



TAAAGGAATG 


AAGTAGATAA 


TATTTAGCAC 


AGCCTCTTGA 


ATCGTTCTGG 


GATCCGCTTT 


13981 


TATAAAGTCA 


AAAGGATTCA 


GTGACATCGC 


CTGAAAATCC 


GTTATTTTAG 


TAAAAAGTAC 


14041 


CATGAATAAC 


AGTAATAAAT 


ACACACTGAA 


AG CAAGAT AG 


AGATAAATAA 


CTGAAAAATA 


14101 


TTTGAGGTGA 


TACTGGATAC 


CAAACAACCA 


GATAATCAGC 


GTTAATAAGA 


GTATTAAAGT 


14161 


CAATGTGGTA 


TAGTCAAAGT 


GGTTAATCAA 


CTTAGCCAGG 


CTTTGATAGC 


GAGTGAGAAC 


14221 


GGGCATAATC 


AfiTCAAGTAA 


T CdTC^fZC* ATA 


a frranfi at a 


A ATflTf2 ZVTr* A 


ATAAACTGCT 


1 AOQT 


GAGGTAGATC 


ATATATTTTC 


GCAACTGTTT 


CTAACTCCTT 


TTCTTGATGA 


GATTAACCCT 


14341 


ATTTTAACAT 


ATTTTAAAAC 


TGTGATGTTT 


TTATGAATTT 


AAAATAAATG 


TTAAAGAAAA 


14401 


TAAAAATTCA 


CCAGTTGGTT 


CTGTTGCAAA 


GTTTTCCAAA 


AAATCTATTT 


TAGTGTAAAA 


14461 


TTGAGAAAAA 


AGACAGAGAG 


GACAGAGTAA 


TGAATTATTT 


TAAAGGCAAA 


CAATTCAAAA 


14521 


AAGACGTCAT 


TATTGTCTCT 


GTTGGTTACT 


ACCTGCGTTA 


CAATCTAAGC 


TATCGTTAAQ 


14581 


TTCAGGAATT 


GTTATATGAT 


C 








14602 



20 



25 



30 



35 



40 



45 



50 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 484 acides amines 
(8) TYPE: acide amine 
(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proline 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

Met Ser Ser Arg Thr Asn Arg Lys Gin Lys His Thr Ser Asn Gly Ser 
1 5 " 10 15 

Trp Gly Met Val Asn Val Gly Leu Thr lie Leu Tyr Ala He Leu Ala 
20 25 30 

Leu Val Leu Leu Phe Thr Met Phe Asn Tyr Asn Phe Leu Ser Phe Arg 
35 40 45 

Phe Leu Asn He He He Thr He Gly Leu Leu Val Val Leu Ala He 
50 55 60 

Ser He Phe Leu Gin Lys Thr Lys Lys Leu Pro Leu Val Thr Thr Val 
65 70 75 80 

Val Leu Val He Phe Ser Leu Val Ser Leu Val Gly He Phe Gly Phe 
85 90 95 

Lys Gin Met He Asp He Thr Asn Arg Met Asn Gin Thr Ala Ala Phe 
100 105 110 

Ser Glu Val Glu Met Ser He Val Val Pro Lys Glu Ser Asp He Lys 
115 120 125 

Asp Val Ser Gin Leu Thr Ser Val Gin Ala Pro Thr Lys Val Asp Lys 
130 135 140 

Asn Asn He Glu He Leu Met Ser Ala Leu Lys Lys Asp Lys Lys Val 
145 150 155 160 

Asp Val Lys Val Asp Asp Val Ala Ser Tyr Gin Glu Ala Tyr Asp Asn 
165 170 175 

Leu Lys Ser Gly Lys Ser Lys Ala Met Val Leu Ser Gly Ser Tyr Ala 
180 185 190 

Ser Leu Leu Glu Ser Val Asp Ser Asn Tyr Ala Ser Asn Leu Lys Thr 
195 200 205 



55 



28 
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He Tyr Thr Tyr Lys lie Lys Lys Lys Asn Ser Asn Ser Ala Asn Gin 
210 215 220 

Val Asp Ser Arg Val Phe Asn He Tyr He Ser Gly He Asp Thr Tyr 
225 230 235 240 

Gly Pro lie Ser Thr Val Ser Arg Ser Asp Val Asn He He Met Thr 
245 250 255 

Val Asn Met Asn Thr His Lys He Leu Leu Thr Thr Thr Pro Arg Asp 
260 265 270 

Ala Tyr Val Lys He Pro Gly Gly Gly Ala Asp Gin Tyr Asp Lys Leu 
275 280 285 

Thr His Ala Gly He Tyr Gly Val Glu Thr Ser Glu Gin Thr Leu Glu 
290 295 300 

Asp Leu Tyr Gly lie Lys Leu Asp Tyr Tyr Ala Arg He Asn Phe Thr 
15 305 310 315 320 

Ser Phe Leu Lys Leu He Asp Gin Leu Gly Gly Val Thr Val His Asn 
325 330 335 



10 



20 



25 



30 



Asp Gin Ala Phe Thr Gin Glu Lys Phe -Asp Phe Pro Val Gly Asp He 
340 345 350 

Gin Met Asn Ser Glu Gin Ala Leu Gly Phe Val Arg Glu Arg Tyr Asn 
355 360 365 

Leu Asp Gly Gly Asp Asn Asp Arg Gly Lys Asn Gin Glu Lys Val He 
370 375 380 

Ser Ala He Leu Asn Lys Leu Ala Ser Leu Lys Ser Val Ser Asn Phe 
385 390 395 400 

Thr Ser He Val Asn Asn Leu Gin Asp Ser Val Gin Thr Asn Met Ser 
405 410 415 

Leu Asn Thr He Asn Ala Leu Ala Asn Thr Gin Leu Glu Ser Gly Ser 
420 425 430 

Lys Phe Thr Val Thr Ser Gin Ala Val Thr Gly Thr Gly Ser Thr Gly 
435 440 445 

Gin Leu He Ser Tyr Ala Met Pro Asn Ser Ser Leu Tyr Met Met Lys 
450 455 460 

35 Leu Asp Asn Ser Ser Val Glu Ser Ala Ser Gin Ala He Lys Lys Leu 

465 470 475 480 

Met Glu Glu Lys 



40 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 243 acides amines 

(B) TYPE: acide amin6 

45 (D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

Val He Asp Val His Ser His He Val Phe Asp Val Asp Asp Gly Pro 
15 10 15 



50 



55 



Glu Thr Leu Glu Glu Ser Leu Asp Leu He Gly Glu Ser Tyr Ala Gin 
20 25 30 

Gly Val Arg Lys He Val Ser Thr Ser His Arg Arg Lys Gly Met Phe 
35 40 45 
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10 



Glu Thr Pro Glu Asp Lys lie Phe Ala Asn Phe Lys Lys Val Lys Ala 
50 55 60 

Glu Ala Glu Ala Leu Tyr Pro Asp Leu Thr lie Tyr Tyr Gly Gly Glu 
65 70 75 80 

Leu Tyr Tyr Thr Ser Asp He Val Glu Lys Leu Glu Lys Asn Leu He 
85 90 95 

Pro Arg Met His Asn Thr Gin Phe Ala Leu He Glu Phe Ser Ala Arg 
100 105 110 

Thr Ser Trp Lys Glu He His Ser Gly Leu Ser Asn Val Leu Arg Ala 
115 120 125 

Gly Val Thr Pro He Val Ala His He Glu Arg Tyr Asp Ala Leu Glu 
130 135 140 

Glu Asn Ala Asp Arg Val Arg Glu He He Asn Met Gly Cys Tyr Thr 
15 145 150 155 160 

Gin Val Asn Ser Ser His Val Leu Lys Pro Lys Leu Phe Gly Asp Lys 
165 170 175 

Asp Lys Val Arg Lys Lys Arg Val Arg Phe Phe Leu Glu Lys Asn Leu 
180 185 190 



20 



Val His Met Val Ala Ser Asp Met His Asn Leu Gly Pro Arg Pro Pro 
195 200 205 

Phe Met Lys Asp Ala Tyr Glu He Val Lys Lys Asn Tyr Gly Ser Lys 
210 215 220 

Arg Ala Lys Asn Leu Phe He Glu Asn Pro Lys Thr Leu Leu Glu Asn 
225 230 235 240 

Gin Tyr Leu 



(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CHARACTER I ST IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 231 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 4: 

35 Met Asn Gin Asp Asn Thr Lys Ser Asp Glu He Asp Val Leu Ala Leu 

15 10 15 

Leu His Lys Leu Trp Thr Lys Lys Leu Leu He Leu Phe Thr Ala Phe 
20 25 30 



30 



40 



Tyr Phe Ala Val Phe Ser Phe Leu Gly Thr Tyr Phe Phe He Gin Pro 
35 40 45 

Thr Tyr Thr Ser Thr Thr Arg He Tyr Val Val Asn Gin Ala Thr Asp 
50 55 60 

Asn Lys Asn Leu Ser Ala Gin Asp Leu Gin Ala Gly Thr Tyr Leu Ala 
65 70 75 80 

45 Asn Asp Tyr Lys Glu He He Ala Ser Asn Asp Val Leu Ser Glu Val 

85 90 95 

He Lys Asp Glu Lys Leu Asn Leu Ser Glu Ala Glu Leu Ser Lys Met 
100 105 110 



50 



55 



Val Ser Val Asn He Pro Thr Asp Thr Arg Leu He Ser He Ser Val 

115 120 125 

Asn Ala Lys Thr Gly Gin Asp Ala Gin Thr Leu Ala Asn Lys Val Arg 

130 135 140 
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10 



15 



45 



Glu Val Ala Ser Lys Lys lie Lys Lys Val Thr Lys Val Glu Asp Val 
145 150 155 160 

Thr Thr Leu Glu Glu Ala Lys Leu Pro Glu Ser Pro Ser Ser Pro Asn 
165 170 175 

lie Lys Leu Asn Val Leu Leu Gly Ala Val Leu Gly Gly Phe Leu Ala 
180 185 190 

Val Val Gly Val Leu Val Arg Glu lie Leu Asp Asp Arg Val Arg Arg 
195 200 205 

Pro Glu Asp Val Glu Asp Ala Leu Gly Met Thr Leu Leu Gly He Val 
2X0 215 220 

Pro Asp Thr Asp Lys He 
225 230 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 249 a c ides amines 

(B) TYPE: acide amine 

M (D) CONFIGURATION: lineaire 

20 (ii) TYPE DE MOLECULE: proteine 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Met Pro Leu Leu Lys Leu Val Lys Ser Lys Val Asp Phe Ala Lys Lys 
1 5 10 15 

Thr Glu Glu Tyr Tyr Asn Ala He Arg Thr Asn He Gin Phe Ser Gly 
25 20 25 30 

Ala Gin Met Lys Val He Ala He Ser Ser Val Glu Ala Gly Glu Gly 
35 40 45 

Lys Ser Met He Ser Val Asn Leu Ala He Ser Phe Ala Ser Val Gly 
50 55 60 

30 Leu Arg Thr Leu Leu He Asp Ala Glu Thr Arg Asn Ser Val Leu Ser 

65 70 75 80 

Gly Thr Phe Lys Ser Asn Glu Pro Tyr Lys Gly Leu Ser Asn Phe Leu 
85 90 95 

Ser Gly Asn Ala Asp Leu Asn Glu Thr He Cys Gin Thr Asp He Ser 
35 100 105 110 

Gly Leu Asp Val He Ala Ser Gly Pro Val Pro Pro Asn Pro Thr Ser 
115 120 125 

Leu Leu Gin Asn Asp Asn Phe Arg His Leu Met Glu Val Ala Arg Ser 
130 135 140 

40 cys Tyr Asp Tyr Val He He Asp Thr Pro Pro Val Gly Leu Val He 

145 150 155 160 

Asp Ala Val He He Ala His Gin Ala Asp Ala Ser Leu Leu Val Thr 
165 170 175 



Glu Ala Gly Lys He Lys Arg Arg Phe Val Thr Lys Ala Val Glu Gin 
180 185 190 

Leu Val Glu Ser Gly Ser Gin Phe Leu Gly Val Val Leu Asn Lys Val 
195 200 205 

Asp Met Thr Val Asp Lys Tyr Gly Phe Tyr Gly Ser Tyr Gly Ser Tyr 
210 215 220 

50 Gly Glu Tyr Gly Lys Lys Ser Asp Gin Lys Glu Gly His Ser Arg Ala 

225 230 235 240 

His Arg Arg Arg Lys Val Gly Trp Asn 



55 
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245 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 227 acides amines 

(B) TYPE: acide amin6 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ser Gin Ala Lys Glu Glu He Ser Asp Val Met Thr Tyr Ser Glu 
1 5 10 15 

Leu Thr Ser His Lys Pro Lys He He Tyr Ser Leu He Lys Arg He 
20 25 30 

Gly Asp He Leu Val Ser Ser He Gly Leu He He Leu He Pro Leu 
35 40 45 

Phe Leu He Val Ala Leu He Met Lys Cys Ser Glu Pro Thr Ala Pro 
50 55 60 . 

He Phe Phe Ser His He Arg Asn Gly Lys Asn Gly Lys Lys Phe Lys 
65 70 75 80 

Met Tyr Lys Phe Arg Thr Met Cys Gin Asp Ala Glu Ser He Leu Met 
85 90 95 

Lys Asp Thr Glu Leu Phe Ala Lys Phe Lys Ala Asn Gly Tyr Lys Leu 
100 105 110 

Glu Thr His Glu Asp Pro Arg He Thr Lys lie Gly Gly He Leu Arg 
115 120 125 

Lys Thr Ser He Asp Glu Leu Pro Gin Leu He Asn Val Phe Leu Gly 
130 135 140 

Gin Met Ser Leu Val Gly Pro Arg Pro Leu Pro Asp Arg Glu He He 
145 150 155 160 

Glu Tyr Gly Asp Asn Gin Glu Lys Phe Leu Ser Val Lys Pro Gly Met 
165 170 175 

Thr Gly Trp Trp Gin Val Ser Gly Arg Ser Thr He Gly Tyr Pro Glu 
180 185 190 

Arg Cys His Leu Glu Leu Tyr Tyr Val Glu Lys Cys Cys Phe Thr Phe 
195 200 205 

Asp Val Leu He Leu Leu Lys Thr He Gly He Val Leu Lys Arg Val 
210 215 220 

Gly Ala Arg 
225 



(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 319 acides amines 

(B) TYPE: acide amin6 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

Met Asn Glu Gin Val Thr Phe He Leu Cys Asp Phe Leu Val Arg Glu 
15 10 15 

He Lys Pro Lys Tyr Asp Leu Leu Ala Tyr Gin Phe He Ser Lys Lys 
20 25 30 
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He Lys Glu He Lys Pro Asp He Val His Cys His Ser Ser Lys Ala 
35 40 45 

Gly Val He Gly Arg Leu Ala Ala Lys Arg Arg Gly Val Lys Lys He 
50 ~ 55 60 

Phe Tyr Thr Pro His Ala Tyr Ser Phe Leu Ala Pro Glu Phe Ser Gly 
65 70 75 80 

Lys Lys Lys Phe Leu Phe Val Gin He Glu Lys Phe Leu Ser Arg Phe 
85 90 95 

Ala Thr Thr Lys He Phe Cys Val Ser He Ala Glu Met Gin Ala Ala 
100 105 110 

Leu Glu Val Asn Leu Asp Lys Thr Asp Lys Phe Gin Val He Tyr Asn 
115 120 125 

Gly Leu Pro Glu He Asp Leu Pro Ser Lys Glu Thr He Arg Ala Gin 
130 135 140 

Leu Gly Leu Glu Lys Ala Ala Val Val He Gly Asn Asn Ala Lys Met 
145 150 155 160 

Ser Glu Gin Lys Asn Pro Met Phe Phe Met Glu He Ala Arg Lys Met 
165 170 175 

He Arg Gin Asn Ala Asn Trp His Phe Val Trp Val Gly Asp Gly Gin 
180 185 190 

Leu Met Pro Leu Phe Gin Ser Phe He Lys Gin Asn Gly Leu Glu Gly 
195 200 205 

Asn He His Leu Leu Gly Glu Arg Pro Asp Ser Glu He Val Val Thr 
210 215 220 

Ala Tyr Asp lie Phe Leu Thr Thr Ser Gin Tyr Glu Gly Leu Pro Tyr 
225 230 235 240 

Ala Pro He Glu Ala Met Arg Ala Gly Val Pro He Leu Ala Thr Lys 
245 250 255 

Val Val Gly Asn Ser Glu Leu Val He Glu Gly Lys Asn Gly Tyr Leu 
260 265 270 

He Asp Leu Glu Trp Ser Lys Ser Val Glu Glu Lys Leu Tyr Lys Ala 
275 280 285 

Ala Lys He Asp Ala Gin Met He Lys Ala Asp Phe Arg Gin Arg Phe 
290 " 295 300 

Ala He Asp Gin He Leu Lys Gin He Glu Thr He Tyr Leu Ala 
305 310 315 

(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DB LA SEQUENCE: 

(A) LONGUEUR: 372 acides amines 

(B) TYPE: acide amine* 

(D) CONFIGURATION: linSaire 
(ii) TYPE DE MOLECULE: prot6ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Lys Lys He Ser He Leu His Phe Ser Gin Val Ser Gly Gly Gly 
15 10 15 

Val Glu Lys Tyr He Lys Leu Phe Leu Lys Tyr Ser Asp Val Thr Lys 
20 25 30 

Phe Asn Asn Tyr Leu Val Ala Pro Asn Leu Glu Asn Tyr Asp Glu Phe 
35 40 45 

Asn Gly Tyr Leu Lys Met Ser Val Asn Phe Asn Met Glu Gin Thr Phe 
50 55 60 

Ser Pro Leu Lys He Phe Lys Asn Val Phe Phe He Arg Ser Val Leu 
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65 70 75 80 

Lys Lys He Asn Pro Asp He Val Tyr Leu His Ser Thr Phe Ala Gly 
85 90 95 

Val Val Gly Arg He Ala Ser He Gly Leu Pro Thr Lys Val Val Tyr 
100 105 110 

Asn Pro His Gly Tip Ser Phe Lys Met Asp Asn Ser Tyr Leu Lys Lys 
115 120 125 

Leu He Phe Lys Leu He Glu Phe Ser Leu Ser Phe Leu Thr Asp Lys 
130 135 140 

Phe He Leu He Ser Glu Ser Glu Tyr He Leu Ala Asn His He Ser 
145 150 155 160 

Phe Asn Lys Ser Lys Phe Ser Leu He Asn Asn Gly Val Glu Val He 
165 170 175 

Thr Gly Asp Ser Arg Asn Glu He Glu Glu He Phe Pro Asn Glu Asp 
180 185 190 

Phe He He Gly Met Val Gly Arg Leu Ser Pro Pro Lys Glu Phe Phe 
195 200 205 

Phe Phe He Asp Phe Ala Lys Lys He Leu Gin He Arg Asn Asp Thr 
210 215 220 

Asn Phe He He Val Gly Asp Gly Glu Leu Arg Ser Glu He Glu Arg 
225 230 235 240 

Met He Leu Asp Asn Gly Leu Gly Asp Lys He Tyr He Thr Gly Trp 
245 250 255 

Val Asp Asn Pro Arg Asn Tyr He Glu Lys Phe Asp Gin Ala He Leu 
260 265 270 

Phe Ser Arg Trp Glu Gly Leu Ser Leu Thr He Ala Glu Tyr Met Ser 
275 280 285 

Gin Lys Lys Thr He Leu Ala Thr Asn He Gly Gly He Asn Asp Leu 
290 295 300 

He Thr Asp Gly Glu Thr Gly Met Leu He Glu Val Gly Asp Leu Asn 
305 310 315 320 

Ser Ala Val Ser Lys Ser Phe Glu Leu Arg Asn Asn Lys Glu Val Ser 
325 330 335 

Asn Gin Leu Ala Asn Asn Ala Tyr Asn Lys Val Val Glu Gin Phe Ser 
340 345 350 

He Glu Lys Gin Met Ala Glu He Glu Ser Leu Phe He Glu Met Cys 
355 360 365 

Asn Asn Glu Lys 
370 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 159 acides amines 

(B) TYPE: acide amin€ 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 

Met Leu He Leu Lys Leu Lys Phe His Leu Lys Ser Leu Phe Leu Lys 
15 10 15 

Trp He Tyr Arg Leu Leu Tyr Leu Lys Lys Phe Gin Phe Gly Ala Arg 
20 25 30 
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Leu Thr Phe Arg Asp Gly Phe His Leu Leu He Glu Lys Ser Gly Lys 

35 40 45 

Val He He Gly Asn His Val Phe Phe Asn Asn Phe Cys Ser He Asa 

50 ' 55 60 

Ala Met Leu Ser Val Thr He Gly Asp Asp Cys He Phe Gly Glu Asn 

65 70 75 80 

Val Lys He Tyr Asp His Asn His Cys Tyr Gin Asn Lys Ser Gin Pro 
85 90 95 

He Ser Lys Gin Gly Phe Ser Thr Ala Ala He Gin He Gly Arg Asn 
100 105 110 

Cys Trp He Gly Ser Gin Val Thr He Leu Lys Gly Val Thr He Gly 

115 120 125 

Asp Asn Ser He He Gly Ala Gly Val Val Val Tyr Gin Asp Val Pro 

15 130 135 140 

Glu Asn Ser He Val Leu Ser Asn Gly Glu He Arg Lys Arg Gly 

145 150 155 



20 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTBRISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 324 acides amines 
(BJ TYPE: acide amin£ 
(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 
25 (Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Tyr Leu Lys Ser Leu He Ser He Val He Pro Val Tyr Asn Val 
15 10 15 

Glu Lys Tyr Leu Glu Lys Cys Leu Gin Ser Val Gin Asn Gin Thr Tyr 
20 25 30 

30 

Asn Asn Phe Glu Val He Leu Val Asn Asp Gly Ser Thr Asp Ser Ser 
35 40 45 

Leu Ser He Cys Glu Lys Phe Val Asn Gin Asp Lys Arg Phe Ser Val 
50 55 60 

Phe Ser Lys Glu Asn Gly Gly Met Ser Ser Ala Arg Asn Phe Gly He 
65 70 75 80 

Lys Lys Ala Lys Gly Ser Phe He Thr Phe Val Asp Ser Asp Asp Tyr 
85 90 95 

He Val Lys Asp Tyr Leu Ser His Leu Val Ala Gly He Lys Ser Glu 
40 100 105 110 

Thr Ser He Val Cys Ser Lys Phe Phe Leu Val Asp Glu Lys Gly Ser 
115 120 125 

Leu Leu Thr Lys Lys Glu Ala Pro Lys Lys Lys Ser Glu Val Val Ser 
130 135 140 



35 



45 

lie Glu Glu Ser lie Lys He Leu Leu Leu Gin Gin Asn Gly Tyr Asp 
145 150 155 160 

Leu Ala Val Trp Gly Lys Leu Tyr Pro Val Ser Phe Phe Glu Thr He 
165 170 175 

Ser Phe Pro Glu Gly Lys Leu Tyr Glu Asp Met Gly Thr Thr Tyr Lys 
50 iso 185 190 

Leu Leu Lys Leu Ala Ser Glu Val Val Phe Leu Asp Ala Tyr Asp Tyr 
195 200 205 
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10 



15 



Ala Tyr 
210 

Lys Lys 
225 

Leu Ala 
Ala Ala 
Glu Gin 



Val Gin 
Leu Asp 
Gin Phe 



Glu Val 
260 

Ala Gin 
275 



Ala Pro 
290 

Ser Leu 
305 



Phe Met 
Ser Phe 
Leu Val Asp Arg 



Arg Pro Asn 
215 

lie He Glu 
230 

Pro Asn Leu 
245 

Lys He Phe 
Lys Gin Leu 



Thr Lys Gly 
295 

Leu Gly Lys 
310 



Ser lie Met Asn 
Met Val 
Ala Leu 



His Glu 
235 



Leu Glu 
265 

Trp His 
280 

Ala Arg 
Ser Leu 



Tyr Val 
250 

He Pro 
Asp He 
Leu Lys 



Phe Leu 
315 



Ser Ser 
220 

Met Glu 
Lys Asn 
Lys Glu 



Lys Lys 
285 

Asn Arg 
300 

Thr He 



Phe Asn Leu 

Asn Asp He 
240 

Arg Ala Phe 
255 

Lys Glu Phe 
270 

Asn Arg Lys 
Leu Gly Ala 



Gly Lys Gin 
320 



20 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 360 a c ides amines 

(B) TYPE: acide amin6 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

Met Val He Tyr Phe Leu Leu Phe Pro Met He Ala Met He Tyr Leu 
1 " 5 .10 15 

Met Thr Leu Leu Leu Arg Gin Lys Ala Gin He Gin Lys Thr He Phe 
20 25 30 

30 Cys Val Leu Thr Phe Gly Thr Leu Gly Phe He Ser Ala Ser Arg Ala 

35 40 45 

Ser Ser Val Gly Thr Asp Val Thr Leu Tyr Glu Asn He Phe Lys Ser 
50 55 60 

He Asn Tyr Gly He Ser Ala Glu Asn Asn Trp Gly Tyr Val He Tyr 
35 65 70 75 80 

Asn Lys Leu He Gly Ser Val Phe Gly Tyr Thr Gly His Glu He Thr 
85 90 95 

Ala Ala Asn Ser Val Leu He Thr He Leu He Gly He Phe He Trp 
40 1 00 105 HO 

Lys Val Ala Glu His Tyr Phe Val Ala Thr Phe Leu Tyr He Ser Leu 
115 ~ 120 125 

Phe Tyr Tyr Ala Thr Ser Phe Asn He Ser Arg Gin Phe He Ala Met 
130 135 140 

Gly Leu Val Leu Val Ala He Ser Phe Ala Leu Asp Lys Lys Val Met 
145 150 155 160 

Pro Trp Phe He Leu Thr Val Leu Ala Thr Leu Phe His Ala Thr Ala 
165 170 175 

He Val Ala Phe Pro Val Tyr Trp Leu Thr Lys Val His Trp Asp Val 
180 185 190 

Lys Lys Thr Leu Ser He Phe Pro He Thr He Phe Ala Ser Phe He 
195 200 205 



45 



50 



55 
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Phe Asp Ala lie Leu Asn He Phe Val Arg Phe Phe Pro His Tyr Glu 
210 215 220 

Met Tyr He Thr Gly Thr Gin Phe Asn He Ser Asp Gin Gly Gin Gly 
225 230 235 240 

Arg Val Val Leu Val Lys He Phe He Leu Leu He Leu Phe Thr Leu 
245 250 255 

Phe Leu Phe Tyr Lys Lys Ser Tyr Ala Leu He Ser Glu Cys His Gin 
260 265 270 

Ser Leu He Ala Leu Thr Thr Val Gly Leu Ser He Gly lie Val Phe 
275 280 285 

Tyr Asn Asn He Leu Leu Asn Arg He Glu Met Phe Tyr Ser He Leu 
290 295 300 

Ser He Val Phe lie Pro He Ala He Asp Tyr He Ser Leu Lys Phe 
305 310 315 320 

Lys Gin Lys Asp Ala Val Arg Leu Met Leu Thr He Gly He Leu Leu 
325 °~ 330 335 

He Thr Leu Val Pro Tyr Tyr He Gin Val Ser Gly Asn Tyr Ser Gly 
340 345 350 

He Leu Pro Tyr Val He Gin Gin 
355 360 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 316 acides amines 
<B) TYPE: acide amin6 
(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Glu Asp Arg Lys Lys Gin Val He Leu He Leu Ser His Arg Asn 
15 10 15 

Thr Leu Ala Leu Lys Ser Thr He Glu Leu Leu Asp Ser Gin Tyr Phe 
20 25 30 

Asp Phe Phe Leu His He Asp Lys Lys Ser Arg He Gin Asp Phe Phe 
35 40 45 

Tyr Leu Lys Lys He Thr Lys Phe Ser Thr He His Phe Ser Glu Arg 
50 55 60 

Lys Asn Val His Trp Gly Gly Phe Ser Met Val Glu Ala Met Phe Ala 
65 70 75 80 

Leu Leu Glu Cys Ala Arg Asp Thr Gly Glu Tyr Ser Tyr Phe His Phe 
85 90 95 

Leu Ser Gly Asp Asp Met Pro He Lys Asp Asn Glu He Val Phe Asn 
100 105 110 

Phe Phe Glu Asn Ser Tyr Pro Lys Asn Phe He Asp He Leu Asp Phe 
115 120 125 

Glu Asn Val Asn Lys Asn Ser Tyr Phe Tyr Glu Pro Pro Glu Met He 
130 135 140 

Glu Glu Arg Val Lys Tyr Tyr Tyr Pro His Met Asp He Leu Asn Arg 
145 ~ 150 155 160 

Lys Gly Thr Asn Phe He Gly Lys Lys Leu He Tyr Leu Gin Lys Leu 
165 170 175 

Leu Lys Val Asn Arg Leu Lys Asn Arg Glu He Glu He Phe Lys Gly 
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180 185 190 

His Gin Trp Cys Ser Leu Thr Asn Gin Phe Val Asp lie Leu Leu Asp 
195 200 205 

Lys Glu Glu Arg Arg Val Gly Lys Ser Tyr Phe Ser Ser Ser Leu lie 
210 215 220 

Pro Asp Glu Cys Tyr Phe Gin Thr Phe Ala Met lie Lys Lys Val Glu 
225 230 235 240 

lie Tyr Gin Gin Lys Asn Met Ser Ala Arg Leu lie Asp Trp Thr Arg 
245 250 255 

Gly Lys Pro Tyr lie Trp Arg Gin Asp Asp Phe Phe Glu lie Met Asn 
260 265 270 

Asp Lys Asp Ser Met Phe Ser Arg Lys Phe Asp Glu Asn Val Asp Arg 
275 280 285 

Lys lie lie Glu Glu lie Tyr lie Lys He Arg Gly Arg Ser Thr Asp 
290 295 300 

Glu Ala Asn Lys He Lys Asp Lys Arg Phe Thr Lys 
305 310 315 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

U) CARACTERISTIOUES DE LA SEQUENCE: 

(A) LONGUEUR: 473 acides amines 

(B) TYPE: acide amine" 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proline 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

Met Asn Lys Tyr Lys Lys Leu Leu Ser Asn Ser Leu Val Phe Thr He 
15 10 15 

Gly Asn Leu Gly Ser Lys Leu Leu Val Phe Leu Leu Val Pro Leu Tyr 
20 25 30 

Thr Tyr Ala Met Thr Pro Gin Glu Tyr Gly Met Ala Asp Leu Tyr Gin 
35 40 45 

Thr Thr Ala Asn Leu Leu Leu Pro Leu He Thr Met Asn Val Phe Asp 
50 55 60 

Ala Thr Leu Arg Phe Ala Met Glu Lys Ser Met Thr Lys Glu Ser Val 
65 70 75 80 

Leu Thr Asn Ser Leu Val Val Trp Cys Phe Ser Ala Val Phe Thr Cys 
85 90 95 

Leu Gly Ala Cys He He Tyr Ala Leu Asn Leu Ser Asn Lys Trp Tyr 
100 105 110 

Leu Ala Leu Leu Leu Thr Phe Asn Leu Phe Gin Gly Gly Gin Ser He 
115 120 125 

Leu Ser Gin Tyr Ala Arg Gly He Gly Lys Ser Lys He Phe Ala Ala 
130 135 140 

Gly Gly Val He Leu Thr Phe Leu Thr Gly Ala Leu Asn He Leu Phe 
145 150 155 160 

Leu Val Tyr Leu Pro Leu Gly He Thr Gly Tyr Leu Met Ser Leu Val 
165 170 175 

Leu Ala Asn Val Gly Thr lie Leu Phe Phe Ala Gly Thr Leu Ser He 
180 185 190 

Trp Lys Glu He Ser Phe Lys He He Asp Lys Lys Leu He Trp Gin 
195 200 205 



38 



EP0 750 043A1 



Met Leu Tyr Tyr Ala Leu 
210 



10 



15 



20 



25 



30 



Leu Leu Asn Ala 
225 

Gly Ala Asn Gly 



ser lie Phe Asn 
260 

Glu Glu Tyr Asp 
275 

His Tyr Leu Ala 
290 

Val Leu Lys Pro 
305 

Ser Trp Gin Tyr 



Phe Ser Asp Phe 
340 

Gly Val Phe Met 
355 

Gin Val Val Leu 
370 

Ala Met Leu Gly 
385 

Gin Lys Phe Val 



Leu Leu He Val 
420 

Glu Phe Leu Tyr 
435 

Val Asn Gin Arg 
450 



Ser Ser 
230 

Leu Leu 
245 

Thr lie 

Ser His 

Thr Phe 

He Val 
310 

Val Pro 
325 

Phe Gly 

Thr Ser 

Leu Pro 

Phe Leu 
390 

Val He 
405 

Leu Ala 
Phe Gly 
Thr He 



Pro Leu He 
215 

Arg Tyr Phe 

Ala Val Ala 

Phe Thr Gin 
265 

Gin Lys Ser 
280 

Leu. Leu Leu 
295 

Glu Lys Val 

Phe Phe Met 

Thr Asn Tyr 
345 

He Tyr Gly 
360 

He He Gly 
3 75 

Thr Thr Phe 
Gin He Lys 



Gin lie Leu 
425 

Leu Ala Leu 
440 

Leu Tyr He 
455 



Pro Ser 

Val Leu 
235 

Thr Lys 
250 

Ala Trp 

Lys Tyr 

Gly Thr 

Val Ser 
315 

Leu Ser 
330 

He Ala 

Thr He 

Leu Asp 

Leu Leu 
395 

Trp Arg 
410 

Cys Leu 
Leu Phe 
He Met 



Ser He Leu 
220 

Phe Phe Leu 

He Pro Ser 

Gin He Ser 
270 

Tyr Ser Asp 
285 

Ser Ala Phe 
300 

Ser Asp Tyr 

Met Leu Phe 

Ala Lys Gin 
350 

Val Cys Val 
365 

Gly Ala Gly 
380 

Arg Val Lys 
He Phe He 



Phe Tyr Leu 
430 

Cys Gly Met 
445 

Ala I^eu Lys 
460 



Trp Trp 

Gly Ala 
240 

He He 
255 

Ala He 

Val Phe 

Met He 

Ala Ser 
320 

Ser Ser 
335 

Thr Lys 

Leu Leu 

Leu Ser 

Asp Thr 
400 

Ser Asn 
415 

Pro Ser 
Leu Val 
He Lys 
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Asn Lys Thr Phe 
465 



Gly Met 
470 



Lys Ser Ser 



(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTER I S T IQUES DB LA SEQUENCE: 

(A) LONGUEUR: 307 acides amines 

(B) TYPE : acide amine 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: linealre 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Lys Gin He Lys Ser Lys He Arg Asp Leu Gin Asn Asn Phe Thr 
15 10 15 

Tyr Val Phe Gly Lys Lys Thr Phe Leu Gly Arg Gly Glu Ala He He 
20 25 30 

He Asp Glu Pro Glu His Gly Asn Leu Gly Asp Gin Ala He Ala Phe 
35 40 45 

Ala Glu Asn Gin Phe Leu Val Asn His Val Ser Val Arg Asp Val Glu 
50 55 60 



39 



EP0 750 043A1 



10 



His Leu He Glu Ser Lys Thr He Ser Glu He Lys Ser He Lys Lys 
65 70 75 80 

Asn He Gly Lys Lys Glu Leu Val Phe Phe His Gly Gly Gly Asn Phe 
85 90 95 

Gly Thr Leu Tyr Leu Lys Tyr Glu Arg He Arg Arg Leu Ala Val Ser 
100 105 no 

Lys Leu Pro Phe Asn Lys Met He Leu Phe Pro Gin Ser He Ser Phe 
115 120 125 

Glu Asp Ser Arg Phe Gly Gin Lys Gin Leu Asn Lys Ser Lys Lys He 
130 135 140 

Tyr Ser Gin Asn Thr Asn Phe He Leu Thr Ala Arg Glu Pro Lys Ser 
145 150 155 160 

Tyr Gly Leu Met Lys Lys Cys Phe Pro Tyr Asn Lys Val He Leu Thr 
15 165 170 175 

Pro Asp He Val Leu Ser Phe Lys Phe Glu Val Thr He Ser Asp Thr 
180 185 190 

His He Gly Lys Glu Lys Asp Ser Val He Thr Tyr Glu Asn Arg Gin. 
195 200 205 

20 

His Tyr Leu Glu He Lys Trp Asp Glu He Ala Gin His Glu Val Ala 
210 215 220 

Leu Thr Asp Arg Leu His Gly Met He Phe Ser Tyr He Thr Gly Thr 
225 " 230 235 240 

Pro Cys Val Val Leu Ala Asn Asn Asn His Lys He Glu Gly Thr Tyr 
25 245 250 255 

Lys His Trp Leu Asn Glu Val Asn Tyr He Arg Phe He Glu Asn Pro 
260 .265 270 

Thr Val Glu Asn He Leu Asp Ala He Asn Asp Leu Lys Gin He Glu 
275 280 285 

Pro His Tyr He Asp Leu Ser Asp Lys Phe Gin Pro Leu He Asp Ala 
290 295 300 



30 



He Lys Gly 
305 

{2) INFORMATIONS POUR LA SEQ ID NO: 15: 
35 (i) CARACTERISTIQUES DE LA SEQUENCE; 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc » "oligonuceotide" 
40 (Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

GTTGCGGCCG CGATAAAGTG TGATAAGTCC AG 32 



45 (2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 oaires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

/ii) TYPE DE MOLECULE: Autre acide nucleique 
50 (A) DESCRIPTION: /desc = "oligonucleotide" 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 

ATAGCGGCCG CTTAGCTCAT GTTGATGCGG 30 
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(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

5 (C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION; linSalre 
(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc = "oligonucleotide" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

CCTGCGGCCG CGCTTCCTAA TTCTGTAATC G 31 



(2) INFORMATIONS POUR LA SEQ ID NO: 18: 
15 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc » "oligonucleotide" 
20 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

CTGGCGGCCG CTACTTCACG TTTCTTTGCA T 31 



(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lin^alre 

(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc = "oligonucleotide" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

TACGCGGCCG CACATAGAAT AAGGCTTTAC G 31 



Revendications 

40 

1. ADN d'origine chromosomique de bacterie lactique codant pour au moins une enzyme impliquee dans la biosyn- 
these de I'EPS presentant la structure repetee 



45 



50 



> x>A-(l -> x)-A-(l -> x)-A-(l -> 

y 

I 

l 

A 



ou n > 1 ; A est choisi dans le groupe forme par p-D-Galp, p-D-Glcp et leurs derives acetyl et phosphatyl; et x et y 
55 a 2, 3, 4, 5 ou 6 sachant que x * y. 

2. ADN selon (a revendication 1 , codant pour au moins une enzyme impliquee dans la biosynthese de I'EPS presen- 
tant la structure repetee 
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•>3)-P-D-Galp(l->3>P-D-Glcp(l->3)-p-I>Gal/7NAc(l-> 
6 

I 

1 

(J-D-Gatp 



w 

3. ADN selon ia revendication 1 , comprenant la sequence nucl6ique SEQ ID NO:1 . 

4. ADN selon la revendication 2 comprenant au moins un g£ne choisi dans le groupe de g&nes d6limrt6s dans la 
75 s6quence nucl6ique SEQ ID NO:1 par les nucl6otides 352-1803. 1807-2535, 2547-3239, 3249-3995, 4051-4731, 

4898-5854, 6425-7540, 7736-8212, 8221-9192, 9285-10364, 10392-11339, 11302-12222, et 12233-13651. 

5. ADN selon la revendication 2, qui est homologue ou qui s'hybride k un ADN selon Tune des revendications 3 et 4. 
20 6. Vecteur recombinant comprenant un ADN selon Tune des revendications 1 k 5. 

7. Proteine susceptible d'§tre impliquGe dans la biosynthfcse de I'EPS pr^sentant la structure r6p§t6e 



->3)-P^D-Galp(l^>3)-P-D-Glcp(l->3)^D-GalpNAc(l-> 

6 



P-D-Gal/? 

30 r r 

et ayant la sequence en acides amines choisie dans le groupe form6 par les sequences SEQ ID NO:2, SEQ ID 
NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6. SEQ ID NO:7, SEQ ID NO:8. SEQ ID NO:9, SEQ ID NO:10, 
SEQ ID NO:11, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, et les sequences homologues fonctionnelles. 

35 

8. Bacterle lactique comprenant, int6gr6 dans son g6nome ou par le moyen d'un plasmide rdplicable, un fragment 
d'ADN selon la revendication 1. 

9. Proc6d6 de production d'un EPS, dans lequel (1) on clone dans un vecteur un fragment d'ADN codant pour les 
40 enzymes impliqu6es dans la biosynthSse d'un EPS selon la revendication 7, ledit vecteur comprenant en outre une 

sequence permettant la replication autonome ou Integration dans une cellule note, (2) on transforme une cellule 
hdte par ledit vecteur, (3) puis on curtive la cellule note transformGe dans des conditions approprtees pour la pro- 
duction d'un EPS. 

45 10. Proc6d6 selon la revendication 9, dans lequel le vecteur comprend en outre une sequence promoteur et d'activa- 
tion traductionnelle fonctionnels dans ladite cellule hdte. 

11. Proc&te de production d'un EPS, dans lequel (1) on clone dans un vecteur un fragment d'ADN codant pour au 
moins une des enzymes impliqu6es dans la biosynth^se d'un EPS, (2) on transforme par ledit vecteur une bacterie 

so lactique produisant le cas §ch6ant un autre EPS, (3) puis on cultive la bacterie lactique transforms dans des con- 
ditions appropri6es pour la production d'un nouvel EPS. 

12. Proc6d6 selon Tune des revendications 9^11, dans lequel on clone dans un vecteur un fragment d'ADN selon 
Tune des revendications 2 & 5. 

55 

13. Utilisation d'un fragment d'ADN d la s6quence SEQ ID NO:1 ou de son brin compl6mentaire, d'au moins 15pb, 
comme amorce utilisable dans une reaction de PCR ou comme sonde pour d&ecter in-vitro ou inactiver in-vivo 
des g6nes de bacteries lactiques impliquSes dans la biosynthfcse d'un EPS. 
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Figure 2 
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